[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Neue EULER Suchmaschine



Am Mittwoch, 21. August 2002 13:28 schrieb Michael Jost:

> Wobei zu Google noch zu bemerken ist, dass deren Rankingalgorithmus zwar im
> Groben bekannt ist (auch nur denen, die sich dafuer interessieren!  -
> Ranking u.a. gemaess der Groesse der Komponenten eines Haupteigenvektors
> der Inzidenzmatrix des die Linkstruktur im WWW repraesentierenden
> gerichteten Graphen...), diverse wesentliche Einzelheiten aber nicht
> veroeffentlicht wurden.

Der Google Algorithmus ist bekannt, da wird auch nur mit Wasser gekocht. Wer 
also wissen will, wie Google die Bewertung der Seitenreihenfolge vornimmt, 
der findet in dieser Publikation einiges:

Page, Lawrence; Brin, Sergey; Motwani, Rajeev; Winograd, Terry, "The PageRank 
Citation Ranking: Bringing Order to the Web"

http://dbpubs.stanford.edu:8090/pub/1999-66

Und in dieser Arbeit wird in einer Übersicht das Google Forschungsprojekt 
vorgestellt:

Sergey Brin and Lawrence Page, "The anatomy of a large-scale hypertextual Web 
search engine"

http://citeseer.nj.nec.com/brin98anatomy.html

Man kann darüber streiten, ob die Veröffentlichung der Wahl eines Algorithmus 
zur Schätzung von Eigenvektoren oder die Wahl von geeigneten 
Konvergenzkriterien noch ausschlaggebend sind - das erhöht die Performance, 
verändert aber nicht den Rankingalgorithmus.

Ganz nebenbei bemerkt, http://alltheweb.com von der Firma FAST verfügt über 
einen mindestens ebenso guten Algorithmus für das sog. "relevance ranking".

Beste Grüße

Jörg Prante
-- 
Jörg Prante
Software-Entwicklung Online-Fernleihe und Dokumentlieferdienste
Hochschulbibliothekszentrum NRW (HBZ)
Jülicher Str. 6, 50674 Köln, Deutschland
Telefon +49-221-40075-156, Fax +49-221-40075-190
http://www.hbz-nrw.de/literatur/fernleihe



Listeninformationen unter http://www.inetbib.de.