[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Suchen in Google - Korrektur (war: Re: Suchmaschinen und Datenbanken)



Liebe Inetbibler,

zu meiner gestrigen Mail muss ich mich ein wenig korrigieren.
Ich behauptete:

> Google hat nämlich (in seiner scheinbar unbezähmbaren "Indexierungswut")
> fast den gesamten Amazon-Server indexiert. Dies lässt sich leicht
> feststellen, wenn Sie bei Google in das Sucheingabefeld
> "allinurl:amazon.de" eintippen. Durch diese Suchanfrage werden alle
> Seiten angezeigt, deren URL "amazon.de" beinhaltet (und die Google
> indexiert hat). Ergebnis: 1,25 Mio. (!) Treffer, d.h. Google hat über 1
> Mio. Internet-Seiten aus dem deutschen Amazon-Server gespeichert.

Mit der Anfrage: allinurl:amazon.de sucht Google scheinbar nicht
"amazon.de" als Phrase, sondern die Begriffe "amazon" und ".de" getrennt
in der URL, weshalb man auch viele Treffer außerhalb der Domain
"amzon.de" findet (z.B. www.domain.de/amazon.html).

Um nur Resultate vom Amazon-Server zu erhalten, muss man die Suchanfrage
wie folgt stellen: 
allinurl:amazon.de site:amazon.de 
Dann wird wirklich nur noch der deutsche Amazon-Server nach der URL
amazon.de abgesucht. Man erhält mit dieser "nur noch" 637.000 Treffer.

Merkwürdig ist allerdings, dass man mit der Anfrage:
allinurl:amazon.de site:www.amazon.de 
insgesamt sogar 639.000 Treffer erhält (dabei ist www.amzon.de
eigentlich nur eine Untermenge von amazon.de).

Aber bei diesen Treffermengen kann sich die Suchmaschine ja auch mal
verzählen - und das sind sowieso nur Annäherungswerte. Von Amazon hat
Google auf jeden Fall eine Menge indexiert.

Im Prinzip gilt dieses Amazon-Beispiel natürlich auch für beliebig
andere Domains von Universitäten etc.

Viele Grüße

Sebastian Wolf

-- 
-------------------------------------
- Sebastian Wolf                    -
- UB Bielefeld ; Internet-Gruppe    -
- Tel.: 0521 / 106-4032             -
- E-Mail: wolf _at__ ub.uni-bielefeld.de  -
-------------------------------------



Listeninformationen unter http://www.inetbib.de.