[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Rechtschreibung und Suche
Hallo Lars, Hallo Liste,
Lars Aronsson wrote:
Bei Google.de hat
man diese Wörter als Synonymen verstanden, aber die Ergebnisse für
Fotografien (8,9 Mio) und Photographien (0,96 Mio) unterscheiden
sich noch!
Meine Frage war eigentlich ob jemand versucht hat, eine
Suchmaschine für die ältere (vor 1901: C, Th) Rechtschreibung zu
konstruieren?
Dieses Phänomen tritt besonders bei Eigennamen und Wörtern, deren
Schreibweise im Zuge einer Rechtschreibreform verändert wurde, auf.
Um diesem Problem beizukommen, wurde von CONVERA – einem Anbieter von
Suchtechnologien – ein patentierter Mechanismus zur Mustererkennung
entwickelt. Mit Hilfe des "Adaptive Pattern Recognition Process" ist es
der Suchmaschine CONVERA RetrievalWare möglich, relevante Dokumente auch
dann zu finden, wenn Suchbegriff und Begriff im Dokument nicht exakt
dieselbe Zeichenfolge aufweisen. Gibt der Anwender also beispielsweise
den Suchterm „Fotografie“ ein, so findet die Suchmaschine sowohl alle
Dokumente, die diese neue Schreibweise enthalten, als auch jene
Dokumente, in welchen noch das alte „Photographie“ verwendet wird.
Tippfehler bei der Suchanfrage, alte oder neue Rechtschreibung ebenso
wie Fehler bei der OCR-Erkennung im Zuge von Scan-Prozessen führen somit
nicht mehr – wie bei anderen Suchmaschinen – zu einer Verringerung des
Recalls (Vollständigkeit der Suchergebnisse), wodurch die Qualität der
Rechercheergebnisse selbstredend signifikant erhöht wird.
Bei Interesse empfehle ich, sich an meine Kollegin zu wenden unter:
elisabeth.harzhauser@xxxxxxxxxxxxxxxxxxx
Mit besten Gruessen aus einem grauen Wien
Hermann Huemer.
***********************************************************
+ Dr. Hermann Huemer
+ mailto: hermann.huemer@xxxxxxxxxxxxxxx
+ http://www.academicus.info
***********************************************************
Listeninformationen unter http://www.inetbib.de.