[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Suche mit Altavista (automatische Phrasen-Erkennung)



Hallo Inetbib,

hier noch ein Nachtrag ueber die merkwuerdigen Suchergebnisse mit
AltaVista. 

Ich habe eben (um 9.30 Uhr) noch einmal diverse Suchen mit *bayern
münchen* in allen möglichen Schreibweisen durchgeführt (auch wenn ich
diesen Verein überhaupt nicht mag ;-) - dabei ist mir folgendes
aufgefallen:

Suchergebnisse (einfache Suche)

1.1) bayern muenchen = 1001
- scheinbar erkennt AltaVisat automatisch(!!) Phrasen, auch wenn diese
nicht als solche gekennzeichnet sind. Zur Kontrolle gab ich ein:

1.2) "bayern muenchen" = 1001
- genauso viele Treffe, wie ohne die Anführungszeichen

Dies klappt aber nur, wenn man die Umlaute auflöst!!! Kontrolle:

2.1) bayern münchen = 527560
- hier wird ganz klar nach *bayern* ODER *münchen* gesucht

2.2) "bayern münchen" = 10065
- hier wird nach *bayern münchen* als Phrase gesucht. Es wird aber
anders gesucht als bei *bayern muenchen*. Also macht AltaVista doch
unterschiede bei den Umlauten.

Allerdings ist es scheinbar egal, ob man nach *münchen* oder *munchen*
sucht. Kontrolle:

3.1) bayern munchen = 10675
3.2) "bayern munchen" = 10675
- auch hier erkennt AltaVista automatisch eine Phrase. Die Ergebnisse
sind mit denen von 2.2 vergleichbar (solche kleinen Unterschiede liegen
höchstwahrscheinlich daran, wie schnell der Server antwortet)

Um ganz sicher zu gehen, dass AltaVista wirklich automatisch Phrasen
erkennt, gab ich ein:

4.1) raumschiff enterprise = 1723
4.2) "raumschiff enterprise" = 1723
- als Teilzeit-Trekkie viel mir gerade nichts anderes ein :-). Diese
Suche bestätigt eindeutig: AltaVista erkennt automatisch Phrasen!


Eine informative und witzig aufbereitet Seite von Stefan Karzauninkat
(einer dieser Namen, die einem im WWW immer wieder ueber den Weg
laufen), wie Suchmaschinen suchen, findet man unter der URL: 
http://www.teamone.de/selfaktuell/htmlsuch.htm
Titel: HTML und Suchmaschinen - Futter für die Robots

Der Titel deutet es an, hier wird beschrieben was die Lieblingsspeisen
der Robots sind, und welche *Nahrung* sie lieber verschmähen.

Der Beitrag findet sich in Selfhtml aktuell - URL:
http://www.teamone.de/selfaktuell/ - (ein Teil des Selfhtml-Kurses) von
Stefan Münz. Dort finden sich aktuelle Themen und Beiträge rund um HTML
und WWW. Ein Blick lohnt sich!

Viele Grüße 

Sebastian Wolf


--------------------------------------
-  Written by: Sebastian Wolf        -
-  FH Hannover, FB Bibliothekswesen  - 
-  Mail: wolf _at__ iks.ik.fh-hannover.de  -
--------------------------------------


Listeninformationen unter http://www.inetbib.de.