[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Literaturrecherche



Bernhard Eversberg wrote:
> Aber wenn man "Digitalisierung von Zettelkatalogen" bei Altavista
> eingibt, kommen  21.385.951 Ergebnisse! Nur ein Scherz, man muss ein +
> vor jedes Wort setzen, dann kommen nur 29. (denn Altavista macht
> automatisch ODER, Google aber UND. Trunkierung hat Altavista aber auch
> nicht.)

Hm ... ein schönes Beispiel dafür, dass auch Bibliothekare, die täglich
mit Suchmaschinen umgehen, die Anleitungen nicht lesen, genauso wie
unsere Benutzer auch nicht die Anleitungen von unseren OPACS lesen ;-)

                        colo*r
                        theat*

sind z.B. beides mögliche Suchanfragen für Altavista, d.h. es ist sowohl
Rechts- als auch Binnentrunkierung. Einschränkungen: man kann erst nach
3 Zeichen das * setzen und es kann für max. 5 Zeichen stehen (das
letztere ist allerdings in meinen Augen eine erhebliche Einschränkung,
gab es früher auch nicht). 

Altavista setzt zwar automatisch "Oder", aber die Gewichtung erfolgt
dann (im Gegensatz zu rein booleschem Retrieval, wo ggf. nur nach
Akzessionsnummer oder anderem Sortierkriterium sortiert wird) doch so,
daß Dokumente, in denen beides vorkommt, weiter oben in der Liste stehen
(neben weiteren Gewichtungskriterien, die zur Anwendung kommen und auf
der Altavista Website etwas genauer beschrieben sind. Aber das ist
natürlich normalerweise längst nicht so effektiv wie das Ranking von
Google. 

Schließlich kann man in Google wie in Altavista eine Phrase wie
"Digitalisierung von Zettelkatalogen" als ebensolche ("...") eingeben,
ohne vor jedes Wort ein + setzen zu müssen.

Was die PDF-Dokumente betrifft, so wird offenbar in Fällen, wo die
PDF-Datei aus gescannten Images besteht, für die Generierung der
Textfassung OCR-Erkennung betrieben - das sieht man dann auch ... ;-)
für das Retrieval evtl. trotzdem noch brauchbar wegen hoher Redundanz in
Volltexten.

Gruß,
Bernd-Christoph Kämper, UB Stuttgart


Listeninformationen unter http://www.inetbib.de.