[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] PDF-dateien im GoogleIndex



On Thu, 25 Jun 2009 09:36:47 +0200
 Sebastian Wolf <sebastian.wolf@xxxxxxxxxxxxxxxx> wrote:

Vielleicht liegt es aber auch daran, dass das PDF aus
Sicht der
Suchmaschine nicht lesbar ist, weil es nur kryptische
Zeichen enthält.
Allerdings spricht dagegen, dass ich aus dem PDF ohne
Problem etwas
herauskopieren kann (bei mir wird es übrigens auch nach
wenigen Sekunden
geladen, ein Timeout kann es also eigentlich auch nicht
sein).

Wenn man es nicht noetig hat, das zu lesen, was ich in
Archivalia schrieb, muss man natuerlich im Nebel
herumstochern.

(1) 28 der damals 38 Freidok-PDFs von mir sind bei Google
indiziert. Es gelingt Google, also zu ihnen vorzudringen.

(2) Fast alle PDFs sind doppelschichtige PDFs, bei denen
unter dem Image ein leicht korrigierter OCR-Text liegt.

(3) An externen Verlinkungen kann es nicht liegen, dass die
PDFs gefunden werden, denn ich selbst verlinkte in
Archivalia nur den Eingang zum Volltext.

Klaus Graf

-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.