[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Suche mit Altavista (automatische Phrasen-Erkennung)



Hallo Inetbib,

es scheint deutlich zu sein, dass AltaVista die Folge der Suchwoerter zuerst
als Deskriptor der eigenen Specialty-Datenbank zu interpretieren versucht:

helmut kohl bzw. "helmut kohl"  --->  17.404 Treffer (aus den
Specialty-Datenbanken?)

Gegenprobe: +helmut +kohl ---> 96.680 Treffer (aus dem allgemeinen Pool?)

Das gilt auch anscheinend bei vorhandenen anhaengenden weiteren
Suchwoertern. So ergibt die Suche
helmut kohl kanzler  ---> 21.987 Treffer (= obige Datenbank ODER kanzler?)

Wird die Phrase aufgebrochen, indem man den weiteren Suchbegriff
dazwischenschiebt, werden die Treffer erheblich zahlreicher, da kein
Specialty-Datenbankeintrag gefunden werden kann und somit der allgemeine
Pool abgefragt wird:
helmut kanzler kohl  ---> 137.655 (= korrekte ODER-Suche?)
Denn
"helmut kanzler"  ---> 13 Treffer
helmut kanzler  ---> 97.380 Treffer

Wie soll man also helmut ODER kohl suchen? Man kann natuerlich mit Advanced
Search suchen, muss dort aber daran denken, Ranking-Angaben zu machen, damit
die Treffermenge nicht eingeschraenkt wird. Diese Zusammenhaenge sind noch
schwerer zu durchschauen.

In der Simple Search sollte es genuegen, die Phrase durch ein -Suchwort
aufzubrechen, also eine NICHT-Bedingung zu formulieren. Es wird sich schon
ein Wort finden lassen, das absolut keinen Bezug zu den erwarteten Treffern
hat oder das gar nicht existiert:
helmut -brattwurst kohl  ---> 300.900 Treffer!

Es gibt noch viel zu entdecken in dieser Welt.

Gruss an alle
von Volker Lenhardt
UB Essen
lenhardt _at__ bibl.uni-essen.de

-----Ursprüngliche Nachricht-----
Von: Wolfgang Bleh <wbleh _at__ tap.de>
An: Internet in Bibliotheken <INETBIB _at__ ub.uni-dortmund.de>
Datum: Mittwoch, 18. November 1998 12:30
Betreff: Re: Suche mit Altavista (automatische Phrasen-Erkennung)


Hallo und Guten Tag,

Sebastian Wolf schrieb am 18 Nov 98, um 9:59 Uhr

> 1.1) bayern muenchen = 1001
> - scheinbar erkennt AltaVisat automatisch(!!) Phrasen, auch wenn diese
> nicht als solche gekennzeichnet sind.

dazu ein kleiner Auszug aus einem Schriftwechsel,
den ich dieser Tage mit einem Digital-Mitarbeiter hatte:

<schnipp>
Haben Sie bemerkt, wie sich seid Oktober die Qualität der
Suchergebnisse verbessert hat? Bisher beruhte das
Ranking im wesentlichen auf der Verteilung des
Suchbegriffes im Dokument. Wir analysieren jetzt auch,
auf welche Dokumente die Anwender zu einem Suchbegriff
am häufigsten zugreifen. Dieses geht in die Gewichtung
mit ein.

Eine erhebliche Verbesserung ergibt sich auch durch das
neue Phrase Detection, welches in der Form heute nur bei
AltaVista implementiert ist. Beispiel: Otto Versand, New
York City. Derartige zusammengesetzte Begriffe werden
ohne . "" + als ein Begriff erkannt. Dokumente mit Otto
oder Versand werden gar nicht angezeigt. Das Phrase
Detection ist aber noch überwiegend für englisch
implementiert, funktioniert aber auch für deutsch ganz
hervorragend.
<schnapp>

ach ja, mein Gespraechspartner meinte auch, man
solle die Zahlenangaben bei der Simple Search
nicht allzu ernst nehmen :)

Gruss

Wolfgang Bleh


**********************************************
Redaktion Internet Intern, Wolfgang Bleh
Tel.: 06486/911350     http://www.intern.de/





Listeninformationen unter http://www.inetbib.de.