[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] InetBib] Neue Suchmaschine von Q-Sensei bietet



Lieber Herr Hehl, liebe Liste,

Hans Hehl schrieb:

gering." Warum erwähnen Sie nicht Google Scholar, das alle anderen
frei zugänglichen Datenbanken wohl an Bedeutung übertrifft bzw. auch
OAIster mehr oder weniger miterfasst?

Man muss ja nicht immer Google erwähnen :) Ich habe zum Vergleich nur die Suchmaschinen erwähnt, die sich auf Open-Access-Dokumente konzentrieren. Natürlich übertrifft Google Scholar in der Gesamtmenge OAIster und BASE. Aber dass Google alle Daten aus OAIster erfasst hätte, kann ich aus eigener Erfahrung nicht bestätigen. Viele Dokumentenserver werden von Google Scholar mehr oder weniger gut erfasst, aber keineswegs immer vollständig.

Da wir mit BASE selbst eine wissenschaftlichen Suchmaschine betreiben,
haben wir schon recht viel Erfahrung mit dem Indexieren von
Dokumentenservern gesammelt und man kann nur sagen, dass die Indexierung
bei weitem nicht so problemlos ist, wie man sich das vielleicht denkt.
Oft sind manuelle Anpassungen nötig, um wirklich alle Dokumente zu bekommen - nicht nur bei den etwas "exotischen" Dokumentensservern. Google Scholar nimmt solche manuellen Anpassungen nicht vor, das wäre für Google viel zu aufwändig. Google verfährt nach dem Motto: Sollen die Repository-Betreiber doch dafür sorgen, dass ihre Daten gut indexierbar sind. Und den Standpunkt von GS kann man auch durchaus nachvollziehen. Hier haben einige Dokumentenserver wirklich Nachholbedarf.

Aber selbst wenn es die Dokumentenserver den Suchmaschinen einfach machen (z.B. über eine Indexseite mit allen Dokumenten), indexiert GS längst nicht alles. Hier ein kleiner Vergleich für unseren Dokumentenserver BieSOn (OPUS-System inkl. einer Indexseite, über die Suchmaschinen alle Dokumente indexieren können).

Insgesamt:  995 Dokumente
in BASE:    994 Dokumente
in OAIster: 990 Dokumente
in Google:  491 Dokumente (PDFs und PS)
in Google Scholar: 444 (!) Dokumente

Also hat GS nicht mal 50% aller Dokumente indexiert - und ob es bei anderen OPUS-Servern viel besser aussieht, bezweifele ich.

Leider sind die Trefferzahlen, die GS bei Volltextsuchen selbst liefert,
meist völlig unbrauchbar, wie auch eine kürzliche Studie von Peter Jasco
wieder gezeigt hat (Online Information Review, 2008, Vol. 32, Nr. 1, S.
102 ff.), da lässt man sich vielleicht auch täuschen, was die tatsächliche Größe des Google-Scholar-Indexes angeht.

Viele Grüße

Sebastian Wolf

--
Sebastian Wolf : sebastian.wolf@xxxxxxxxxxxxxxxx
Universitätsbibliothek Bielefeld : Gruppe Elektronische Dienstleistungen
Tel.:      +49 521 1064044
Website:   http://www.ub.uni-bielefeld.de/
Bookmarks: http://del.icio.us/bibliothekswelt/
Feeds:     http://www.bloglines.com/public/bibliothekswelt/



Listeninformationen unter http://www.inetbib.de.