[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Google wird kommerzieller
Am 2.4. schrieb S. Hoelzer:
> Wir glauben, dass die
> entscheidende Kernkompetenz einer Bibliothek in der themen-bezogenen
> Ordnung, Verschlagwortung und Strukturierung ihrer Ressourcen liegt.
Das gehoert in der Tat zu unserem seit langem unveraenderten Paradigma:
http://www.allegro-c.de/regeln/pwx.htm
> Ausgehend von diesen Ã?berlegungen wurde eine
> themenbezogene Suche mittels neuer Suchverfahren im Rahmen von
> Forschungsarbeiten an der Universität Giessen in enger Zusammenarbeit
> mit der dortigen Bibliothek realisiert. Dabei kommt eine sogenannte
> semantische (assoziative) Suchmaschine zum Einsatz. Grundsätzlich
> erlaubt diese Technik eine Verbesserung der Suchpräzision, die der
> klassischen (Voll-)Textsuche weitaus überlegen ist, ohne zusätzliche
> Kenntnisse vom Endbenutzer zu erfordern. Dies kommt insbesondere bei
> sehr gro�en, definierten Suchräumen (umfassende
> Bibliotheksbestände)
> zum Tragen. Die Suchtechnologie vom LuMriX erlaubt es mehrere
> Suchbegriffe (Begriffsmoleküle) zu sinnvollen Themen zu kombinieren.
> Dabei werden sogenannte Themen-Netze, die mit dem ISO-Standard "Topic
> Maps" repräsentiert und aus beliebigen Dokumenten (PDF, HTML, XML,
> RDF, etc.) aufgebaut werden, durchsucht. Ein Beispiel zeigt:
> http://geb.uni-giessen.de/geb/
>
Dabei bemerke ich folgendes: mit Eingabe von "schuldrecht" findet man
Dokumente,
die ein mit "schuld" beginnendes Wort enthalten und ein anderes, das mit
"recht"
beginnt. Gibt es eine einfache, von Nutzern nachvollziehbare Erklaerung, was
man
wie finden kann (und wie nicht)? Also, auf was man sich verlassen kann? (Das
ist
es, was wir aus Sicht des Formalkatalogs brauchen.)
Werden die genannten Themen-Netze irgendwie sichtbar gemacht? Entstehen sie
vollautomatisch?
Eine andere Feststellung: wenn man ein nicht vorkommendes Wort (z.B. ein
falsch
geschriebenes!) eingibt, kommt manchmal eine Null-Treffer-Meldung, manchmal
eine
Vorschlagsliste von Woertern, manchmal kommen irgendwelche Datensaetze. Fuer
einen Katalog ist das nicht gut genug, man muss dann ein Register zu sehen
bekommen, und auf Wunsch jederzeit, in dem man erkennt, was es wirklich gibt
und
was es nicht gibt, also die tatsaechlich vorkommenden Woerter.
> Wie das Beispiel zeigt, bleibt die Suche trotzdem einfach und intuitiv
> zu bedienen, weil der Nutzer selbst gewählte Stichworte eingeben kann
> und trotz Tippfehler, Umlaute, zusammengesetzter Begriffe,
> Abkürzungen
> und anderen Schreibweisen fündig wird.
Manchmal, aber manchmal eben nicht.
Gibt man, falsch, rechtspoltik ein, dann kommt ein Treffer, in dem
"rechtsgerichteten" und "politicization" vorkommt, aber nichts relevantes.
Jetzt muss der Nutzer selber merken, dass er sich vertippt hat. Wenn er Null
Treffer bekommt, liegt diese Vermutung naeher... Es ist, meine ich, ein
Irrweg,
auf Biegen und Brechen das Nulltreffer-Erlebnis zu verhindern, weil man damit
zwangslaeufig die Praezision (die Relevanz) mindert und zu nicht mehr
nachvollziehbaren Ergebnissen kommt. Als Nebenwirkung erhaelt man bei
praezise richtigen Eingaben viele zusaetzliche, nicht relevante Treffer.
Ein Formalkatalog sollte im Falle nicht vorhandener Woerter, wie gesagt,
lieber
ein Register zeigen. Fuer die sachliche Suche kann Ihr Verfahren sicher oft
helfen, ABER der Nutzer muss natuerlich mitdenken - wie immer. Er wird dazu
nicht
automatisch animiert, das muss schon an der Oberflaeche irgendwie vermittelt
werden. Also keine Angst, ihm den Gebrauch des eigenen Verstandes zuzumuten,
es
kann ihm nur nuetzen. Im Sinne von Kant's "Was ist Aufklaerung?" ist das
sogar
unbedingt notwendig:
http://gutenberg.spiegel.de/kant/aufklae/aufkl001.htm
Was ist denn die groesste Datenmenge, mit der Ihr Verfahren eingesetzt wird?
MfG
B.E.
Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329,
D-38023 Braunschweig, Germany
Tel. +49 531 391-5026 , -5011 , FAX -5836
e-mail B.Eversberg@xxxxxxxx
Listeninformationen unter http://www.inetbib.de.