[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Suchmaschine SCIRUS
Lieber Herr Graf, lieber Herr Eversberg,
es handelt sich aus meiner Sicht um eine spannende Debatte, wobei die
berechtigten Nutzerforderungen (vertreten durch Herrn Graf) fuer das WWW
in der Praxis wohl noch eine Weile kaum oder nur in Ansaetzen erfuellbar
(Stichwort: Semantisches Web) sein werden.
Herr Graf hat mit den WWW-Katalogen, die ja im wesentlichen intellektuell
erschliessen, eine wichtige Alternative zu Search Engines in Erinnerung
gerufen, die haeufig schon in Vergessenheit geraten ist. Auch die Idee
dies zu kombinieren (hochrangige Ergebnisse aus der Rubrik XY kommen
an den Anfang einer Ergebnisliste von Suchmaschinen), ist
im Prinzip vielversprechend.
Ich hatte daher ein paar vage Hoffnungen auf Yahoo (arbeitet im Tandem mit
Google) und MSN Search (benutzt Katalog von Look Smart und eigene
Redakteure) gesetzt. Die Suche mit "Mittelalter" bleibt aber auch hier
ernuechternd. Bei den Treffern handelt es sich ueberwiegend um
Mittelalterfeste, Troedel, Vereine usw., kaum wissenschaftliche Quellen.
Warum? Der Schluessel dazu heisst schon Ranking. Aber eben Ranking nach
der groessten Zahl. Das Schluesselwort, das in Ihrer Debatte noch nicht
gefallen ist, heisst "Popularitaet". Und ich wage mal die Prognose, dass
diese "Treffer" eben u.a. deshalb oben gelistet werden, weil sie nun mal
zu den beliebteren gehoeren, ob das Wissenschaftlern passt oder nicht.
Die Frage stellt sich fuer kommerzielle Suchmaschinenbetreiber also
nicht in der Form: wie koennen wir das sachliche Retrieval (fuer
Wissenschaftler) technisch optimieren, sondern: warum sollten wir da aus
betriebswirtschaftlicher Sicht ueberhaupt etwas aendern.
Wuenschenswert waere also eine Art "Google fuer die Wissenschaften". Aber
auch da wird Popularitaet eine gewisse Rolle spielen. :)
Zum "Clustering" faellt mir noch ein: Sinnvolles Clustering am Bsp. von
einem Wort, das auch noch in verschiedenen Kontexten Sinn macht, ist ziemlich
problematisch. Man muss schon bei der Eingabe ein semantisches Umfeld
mit mehreren Begriffen "umreissen" (am Ende kommt es in Suchmaschinen
als ein Abgleich von Zeichenketten heraus).
Mit freundlichem Gruss
Mario Kowalak
-------------------------------------------------------------------------
Freie Universitaet Berlin Mario Kowalak
Universitaetsbibliothek
Informationszentrum und
Web-Team
Garystrasse 39 Tel: (030) 838-54227/-54273
14195 Berlin E-Mail: kowalak _at__ ub.fu-berlin.de
-------------------------------------------------------------------------
On Tue, 5 Nov 2002, Klaus Graf wrote:
> Bernhard Eversberg schrieb:
>
> > Aber: wenn einer wirklich nur "Mittelalter" eingibt, kann kein Algorithmus
> > feststellen, auf welchen Diskurs sich das beziehen soll.
>
> Vielleicht erinnert man sich, was ich geschrieben hatte. Ausgangspunkt
> war genau die Feststellung, dass bei Eingabe von Mittelalter
> Wissenschaftler (vielleicht 5 % der Internet-Nutzer, vielleicht auch
> mehr, es steht sicher irgendwo) wissenschaftliche Seiten erwarten, Laien
> aber Seiten, die sich mit Mittelaltergruppen, Mittelaltermaerkten und
> vergleichbarem Schabernack bzw. neutraler formuliert: Zeitvertreib
> beschaeftigen. Daher schrieb ich, Ziel muesste eine Rueckfrage an den
> Benutzer sein, was er wuenscht.
>
> Die Koexistenz zweier Diskurse ist eine empirische Frage, die aber
> vielleicht durch Algorithmen, die auf Linkgemeinschaften basieren,
> nachvollzogen werden kann.
>
> Eine solche Gruppierung ist doch auch nichts anderes als das Clustering,
> was manche Suchmaschinen bereits anbieten.
>
> Anders als beispielsweise bei der Eingabe von "Stadtpatron" handelt es
> sich bei der Einwort-Suche Mittelalter um eine hinreichend globale
> Fragestellung. Und in einem solchen Fall waere die Suchmaschine gut
> beraten, eigene oder fremde thematische Verzeichnisse in das Ranking mit
> einzubeziehen.
>
> Leider stelle ich in meiner Uebung fest, dass kaum Kenntnisse ueber
> thematische Verzeichnisse verbreitet sind. Auch das Google-Verzeichnis
> ist so gut wie nicht bekannt, obwohl es bei einer Suche ganz oben steht.
> Und in der Ranking-Reihenfolge steht von den dort redaktionell (dmoz)
> gelisteten Seiten die MGH an erster Stelle.
>
> Es mag ja didaktisch richtig sein, dass Herr Eversberg darauf verweist,
> wie "dumm" Suchmaschinen eigentlich sind, aber ich denke nicht, dass
> seine Ausfuehrungen unwidersprochen bleiben muessen.
>
> Wenn Suchmaschinenbetreiber sich entscheiden wuerden, staerker auf
> thematische Verzeichnisse zu setzen, dann waere es ganz egal, ob es auf
> der Seite des Mittelalters heisst oder das Mittelalter. Eine
> Metadatenerschliessung kann ja auch von dritter Seite erfolgen, auch
> wenn es natuerlich sinnvoll ist, dass die Webmaster selbst Metadaten
> festlegen.
>
> Ein schlagendes Beispiel sind die genannten MGH: dort heisst es auf der
> Startseite kein einziges Mal Mittelalter. Google koennte ohne weiteres
> formal festlegen: Wenn es zu der Suchanfrage eine Kategorie im
> thematischen Verzeichnis gibt, stelle sicher, dass die erste Seite in
> der Ranking-Reihenfolge unter den top ten der Ergebnisliste ist. Ob
> Google das möchte, ist eine andere Frage - sie hat nichts damit zu tun,
> was derzeit machbar ist.
>
> Klaus Graf
>
>
>
Listeninformationen unter http://www.inetbib.de.