[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Intelligentes Retrieval bei Excite
Lieber Inetbibler,
die Concept Search von Excite erscheint mir doch so interessant, dass
ich kurz berichten moechte, was ich darueber herausgefunden habe.
Das Verfahren funktioniert so: Unverbunden eingebene Suchbegriffe,
z.B. > elderly people financial concerns < werden zunaechst exakt
gesucht, aus den gefundenenn Dokumenten werden dann durch
statistische Analyse zusaetzliche Begriffe ermittelt, die signifikant
haeufiger in diesen vorkommen - in dem genannten Beispiel z.B. "risk".
Diese werden in einer Sekundaersuche - vermutlich mit geringerer
Gewichtung - mitgesucht. Wenn man so will wird fuer die Suche ein
dynamisch erzeugter Thesaurus verwendet.
Der Effekt ist schwer hieb- und stichfest zu belegen, da es praktisch
unmoeglich ist, Treffer zu finden, in denen keiner der Original-
Suchbegriffe mehr vorkommt. Insofern lassen sich alle Treffer stets
auch als Ergebnis einer ODER-Verknuepfung (bzw. fuzzy-AND-Suche)
interpretieren. Nimmt man aber das obige Beispiel, so stellt man
fest, dass in dem ersten Treffer die Begriffe "financial" und
"concerns" gar nicht vorkommen, aber auffallend haeufig der Begriff
"risk" (waehrend z.B. der 3. Treffer saemtliche Originalbegriffe
enthaelt). Weiteres Plausibilitaetsargument: Nach Anklicken der
ersten 20 Treffer und (einiger weniger mehr) suchte ich mit
> senior citizens financial concerns < und fand unter den ersten
10 Treffern immerhin 7 "followed links", was im Falle einer exakten
Suche relativ unwahrscheinlich ist.
Fazit: Die Concept Search fuehrt zwar im Einzelfall auch zu falschen
Treffern - der "erste Treffer" s.o. ist ein solcher - , man findet
andrerseits aber viele relevante Treffer, auf die man sonst nicht
gestossen waere. Die Zufaelligkeiten einer Stichwortsuche - fuer die
in absehbarer Zeit kein Ersatz in Aussicht ist - werden durch
intelligentes Retrieval so teilweise kompensiert.
MfG
W.Binder
Listeninformationen unter http://www.inetbib.de.