[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Suchmaschinenkunde



Eine meines Erachtens ganz wichtige, viel zu wenig bekannte
Recherchestrategie besteht darin, wissenschaftlich brauchbare Literatur
ueber den Umstand aufzuspueren, dass in ihr massgebliche
Forschungsliteratur zitiert wird.

Wer also gehaltvolle WWW-Beitraege zur wuerttembergischen Geschichte
sucht, koennte Stälins Wirtembergische Geschichte zum Ausgangspunkt
nehmen. Wir geben Stälin ohne Vornamen ein, um sowohl Treffer mit vollem
als auch mit abgekuerztem Vornamen zu erhalten. Internationale
Suchmaschinen werfen auch fremdsprachige Beitraege aus, da ein korrektes
Zitat des Titels in allen Sprachen gleich lautet und auf jeden Fall
"Wirtembergische Geschichte" enthalten wird.

http://www.google.de/search?as_q=st%E4lin+&num=100&hl=de&ie=ISO-8859-1&btnG=Google-Suche&as_epq=wirtembergische+geschichte&as_oq=&as_eq=&lr=&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=

Bei den uebersprungenen Resultaten handelt es sich um Mehrfachtreffer,
die inhaltlich durchaus relevant sein koennen, weshalb man nicht in
jedem Fall auf ihre Anfuehrung verzichten sollte:

http://www.google.de/search?q=st%C3%A4lin++%22wirtembergische+geschichte%22&num=100&hl=de&lr=&ie=UTF-8&as_qdr=all&filter=0

Und nun Metager: Stälin Wirtembergische Geschichte

Ich habe zusaetzlich zur Voreinstellung noch Alltheweb und Lycos
(international) angeklickt.

Laestig finde ich die Dubletten, die gleiche Seite erscheint anders als
bei Google mehrfach.

Google findet Seiten, die  Metager nicht findet, wie umgekehrt auch
Metager Seiten findet, die bei Google fehlen.

Allerdings kann das Plusgut von Metager auch durch die ohnehin
empfehlenswerte Benutzung von
http://www.alltheweb.com
gefunden werden, Metager muss also nicht sein.

Warum findet aber Google manche Seiten nicht? Bei den Mitteilungen der
Residenzenkommission ist es offenbar so, dass Google - ueberpruefbar am
sog. Google-Cache ("Im Archiv") - von dieser sehr grossen Datei nur 101
KB abspeichert. Das gleiche ist der Fall bei der Klostergeschichte von
Denkendorf. (Man ueberpruefe die Suche bei Google und Alltheweb:
Denkendorf Stälin Werner) 

Wovon haengt es ab, dass Google mehr als 101 KB erfasst? Ich habe keine
Ahnung, obwohl es in der unendlichen Google-Webliteratur sicher viele
Antworten darauf gibt.

Das deep oder invisible web scheint also noch tiefer und unsichtbarer
geworden zu sein.

So erinnere ich mich, vor einiger Zeit ueber Google auf eine Freiburger
Dissertation von 2000 auf dem Volltextserver (Ruth, Ämtergefüge)
aufmerksam geworden zu sein und zwar aufgrund einer - heute nicht mehr
erfolgreichen - Suche nach dem Professor Kaspar Baldung. Damals war das
entsprechende PDF von Google vollstaendig indiziert. Heute ist nicht
einmal der Titel der Arbeit bei den beiden Grossen (Google und
Alltheweb) zu finden, Metager hat, wenn man ALLE Suchmaschinen einzeln
anklickt genau einen Treffer bei der sonst von mir nie benuetzten
Suchmaschine Tricus.

Es heisst in den Freidok-FAQ zwar
"Internet-Suchmaschinen: Die sog. Frontdoor einer elektronischen
Publikation in FreiDok wird auch von vielen
Internet-Suchmaschinen indexiert"
aber ich kann mir trotzdem nicht erklaeren, warum die wichtigsten
Suchmaschinen die Publikation ignorieren.

Die Volltextsuche von Freidok hat uebrigens gerade auch nicht
funktioniert (Suche nach Baldung). Im KVVK ist keine Vollextsuche in den
Dokumenten moeglich.

Ein katastrophales Ergebnis, wie ich finde!

Klaus Graf


Listeninformationen unter http://www.inetbib.de.