[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Neue EULER Suchmaschine
- Date: Wed, 21 Aug 2002 13:08:45 +0200
- From: Jörg Prante <prante _at__ hbz-nrw.de>
- Subject: Re: Neue EULER Suchmaschine
Am Mittwoch, 21. August 2002 13:28 schrieb Michael Jost:
> Wobei zu Google noch zu bemerken ist, dass deren Rankingalgorithmus zwar im
> Groben bekannt ist (auch nur denen, die sich dafuer interessieren! -
> Ranking u.a. gemaess der Groesse der Komponenten eines Haupteigenvektors
> der Inzidenzmatrix des die Linkstruktur im WWW repraesentierenden
> gerichteten Graphen...), diverse wesentliche Einzelheiten aber nicht
> veroeffentlicht wurden.
Der Google Algorithmus ist bekannt, da wird auch nur mit Wasser gekocht. Wer
also wissen will, wie Google die Bewertung der Seitenreihenfolge vornimmt,
der findet in dieser Publikation einiges:
Page, Lawrence; Brin, Sergey; Motwani, Rajeev; Winograd, Terry, "The PageRank
Citation Ranking: Bringing Order to the Web"
http://dbpubs.stanford.edu:8090/pub/1999-66
Und in dieser Arbeit wird in einer Übersicht das Google Forschungsprojekt
vorgestellt:
Sergey Brin and Lawrence Page, "The anatomy of a large-scale hypertextual Web
search engine"
http://citeseer.nj.nec.com/brin98anatomy.html
Man kann darüber streiten, ob die Veröffentlichung der Wahl eines Algorithmus
zur Schätzung von Eigenvektoren oder die Wahl von geeigneten
Konvergenzkriterien noch ausschlaggebend sind - das erhöht die Performance,
verändert aber nicht den Rankingalgorithmus.
Ganz nebenbei bemerkt, http://alltheweb.com von der Firma FAST verfügt über
einen mindestens ebenso guten Algorithmus für das sog. "relevance ranking".
Beste Grüße
Jörg Prante
--
Jörg Prante
Software-Entwicklung Online-Fernleihe und Dokumentlieferdienste
Hochschulbibliothekszentrum NRW (HBZ)
Jülicher Str. 6, 50674 Köln, Deutschland
Telefon +49-221-40075-156, Fax +49-221-40075-190
http://www.hbz-nrw.de/literatur/fernleihe
Listeninformationen unter http://www.inetbib.de.