[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: OPAC-Umfrage: Ergebnisse
Peter Seitz wrote:
> Hier muss ich nun auch mal kommentieren!
> Hiermit haben wir schon drei Verfahren, welche unter den Begriff
> Fuzzy Search fallen. Somit faellt die Definition fuer den Begriff
> "Fuzzy-Search" schon sehr _unscharf_ aus...
Ja, da gibt es verschiedene Alternativen, die wir kennen und für OPACs testen
sollten.
> Noch viel erschreckender war fuer mich zu erfahren, dass dieses FUZZY-
> Search von Oracle nur fuer die englische Sprache zur Verfuegung steht.
> Bis ein deutsches Modul auf den Markt kommt, welches wir dann fuer
> unsere Datenbanken (verzeihung OPACs) einsetzen koenne wird wohl noch
> einige Zeit vergehen.
Wenn es Bibliothekare als Anwälte ihrer Kunden nicht fordern oder selbst
entwickeln, kann das tatsächlich noch lange dauern. Ich finde es allerdings
auffällig, wie hartnäckig wir den Firmen gegenüber sind, wenn es um die
Umsetzung unserer eigenen Wünsche an Arbeitskomfort geht :-(
> Daher interessiert mich ganz brennend, ob es ueberhaupt schon im
> deutschsprachigen Raum Bibliothekskataloge (also sozusagen OPACs)
> gibt, welche mit fuzzy search arbeiten?
Deswegen (s.o.) eben nicht. Oder???
Im englischsprachigen Raum wird seit 12 Jahren ein Soundex-Algorithmus mit
gutem Erfolg in den von dem OKAPI-Projekt entwickelten OPACs angewendet. Der
verwendete Algorithmus (einschließlich verworfener Alternativen wie z.B.
Trigramme) ist in folgender Schrift dokumentiert:
Walker, S. und Jones, R.M.: Improving subject retrieval in online catalogues:
1. Stemming, automatic spelling correction and cross-reference tables"
British Library Reesearch Paper 24, The British Library Research and
Development Department, 1987.
Der in OKAPI verwendete Soundex-Algorithmus berücksichtigt die englische
Phonetik und ihre orthographischen Entsprechungen. Man kann das Prinzip ohne
weiteres für die deutsche Sprache übernehmen, wenn man es will. Eine
Studentin am FB Informatik der Hamburger FH hat das mal nach der Vorgabe
eines Artikels in C't (hier 'Phonem-Algorithmus' genannt) getan und an ca.
8.000 EKZ-Datensätzen mit Erfolg ausprobiert. Der Algorithmus müßte in
folgender Schrift zu finden sein:
Wilde,G. und Meyer, C.: Nicht wörtlich genommen. In: C't (1988), Heft 10, S.
126-131
Gruner & Jahr wendete vor ca. 10 Jahren bereits einen Algorithmus für die
Suche nach ähnlich lautenden, aber unterschiedlich geschriebenen Eigennamen
an; ob die Datenbank noch heute in dieser Form existiert, weiß ich nicht.
Wie sich so ein Algorithmus auf eine OPAC-Suche auswirken kann und andere
Methoden der benutzerorientierten Gestaltung von OPACs hab ich mal in einem
Aufsatz beschrieben, der leider noch immer nicht überholt ist:
Ursula Schulz: Was wir über OPAC-Nutzer wissen: Fehlertolerante Suchprozesse
in OPACs. In: ABI-Technik 14 (1994) 4, S. 299-310.
> Uebrigens vertrete auch ich die Meinung, dass der Anwender klar
> waehlen koennen muss, welche Suchmethode er anwenden will und dass
> der Katalog --- wenn ueberhaupt --- nur Ergebnisse mit einer anderen
> Suchmethode ZUSAETZLICH zum tatsaechlichen Suchlauf anzeigen sollte.
Was würden Sie einem indischen Koch antworten, wenn er Sie fragt, ob Sie Ihr
Gericht lieber mit Kari phulia oder mit kalonji gewürzt haben möchten? ;-)
Mit freundlichen Grüßen von Ursula Schulz
Listeninformationen unter http://www.inetbib.de.