[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Intelligentes Retrieval bei Excite



Lieber Inetbibler,

die Concept Search von Excite erscheint mir doch so interessant, dass 
ich kurz berichten moechte, was ich darueber herausgefunden habe.
Das Verfahren funktioniert so: Unverbunden eingebene Suchbegriffe, 
z.B. >  elderly people financial concerns  <   werden zunaechst exakt 
gesucht, aus den gefundenenn Dokumenten werden dann durch 
statistische Analyse zusaetzliche Begriffe ermittelt, die signifikant 
haeufiger in diesen vorkommen - in dem genannten Beispiel z.B. "risk". 
Diese werden in einer Sekundaersuche - vermutlich mit geringerer 
Gewichtung - mitgesucht. Wenn man so will wird fuer die Suche ein 
dynamisch erzeugter Thesaurus verwendet.
Der Effekt ist schwer hieb- und stichfest zu belegen, da es praktisch 
unmoeglich ist, Treffer zu finden, in denen keiner der Original-
Suchbegriffe mehr vorkommt. Insofern lassen sich alle Treffer stets 
auch als Ergebnis einer ODER-Verknuepfung (bzw. fuzzy-AND-Suche) 
interpretieren. Nimmt man aber das obige Beispiel, so stellt man 
fest, dass in dem ersten Treffer die Begriffe "financial" und 
"concerns" gar nicht vorkommen, aber auffallend haeufig der Begriff 
"risk" (waehrend z.B. der 3. Treffer saemtliche  Originalbegriffe 
enthaelt). Weiteres Plausibilitaetsargument:  Nach Anklicken der 
ersten 20 Treffer und (einiger weniger mehr) suchte ich mit    
>  senior citizens financial concerns  <  und fand unter den ersten 
10 Treffern immerhin 7 "followed links", was im Falle einer exakten 
Suche relativ unwahrscheinlich ist.

Fazit: Die Concept Search fuehrt zwar im Einzelfall auch zu falschen 
Treffern - der "erste Treffer" s.o. ist ein solcher - , man findet 
andrerseits aber viele relevante Treffer, auf die man sonst nicht 
gestossen waere. Die Zufaelligkeiten einer Stichwortsuche - fuer die 
in absehbarer Zeit kein Ersatz in Aussicht ist - werden durch 
intelligentes Retrieval so teilweise kompensiert.

                                             MfG
                                             W.Binder


Listeninformationen unter http://www.inetbib.de.