[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Die Zukunft der Suche
Lieber Herr Dietz,
vielleicht ist Ihr Posting als Warnung gedacht.
Ohne Anmerkungen erscheint es wie eine Werbung für die Veranstaltung.
Das von Ihnen zitierte Abstrakt verspricht aber leider nur eine geringe
Relevanz.
Was soll mensch davon halten, wenn ein vermeintlich hochkarätiger
Vertreter von Google nicht in der Lage ist den Unterschied zwischen
'Genauigkeit' (Precision) und 'Wichtigkeit' (Relevance) zu verstehen?
Entschuldigend für Herrn Alby mag sicher gelten, dass sich ein Gigant
wie Google schon länger nicht mehr mit so etwas Langweiligem wie
Precision rumärgern muss.
Per se wird alles ein Treffer sein (Recall=100%) und alleine das
'Relevance Ranking' bestimmt, was die Kunden auf den ersten Seiten der
Trefferliste sehen.
Ich weiß, Besserwisser machen sich nicht beliebt. Aber wenn so ein Text
unkommentiert weitergeleitet wird kann ich mich leider nicht
zurückhalten. (siehe unten)
Viele Grüße
Uwe Reh
Am 06.05.2016 um 15:52 zitierte Karl Dietz:
Die Zukunft der Suche
Tom Alby, Google Germany GmbH
DGI-Konferenz in Frankfurt am Main, 19.-20.05.2016
http://dgi-info.de/wp-content/uploads/2015/11/Tom-Alby.pdf
Suchmaschinen basierten vor nicht allzu langer Zeit auf zwei
Prinzipien: Recall und Precision.
Soweit so gut.
Zunächst müssen die relevanten Dokumente in einem Corpus gefunden werden
(Recall)
Fast. "Zunächst müssen möglichst ALLE relevanten Dokumente gefunden
werden (Recall)."
und schließlich
Noch nicht! Es sollte auch möglichst wenig Schrott gefunden werden
(Precision).
und schließlich die relevantesten Dokumente an die Spitze der Suchergebnisliste
kommen
(Precision).
Richtig, nur heißt dieses dritte Prinzip 'Relevance Ranking' und hilft
dabei mit dem Konflikt zwischen 'Recall' und 'Precision' besser umzugehen.
Dies setzt voraus, dass sich bereits alle potentiell
relevanten Dokumente im Corpus befinden.
"Auch richtig, nur ist dieser überflüssige Satz eine Wiederholung des
oben eingeführten Begriffs 'Recall'"
An dem Grundprinzip hat sich heute nichts geändert, nur dass mehr Signale und
Datenquellen
einbezogen werden wie zum Beispiel Videos, Tweets und Bilder.
<ironie an>
"Aha, das ist mir jetzt ganz neu. Sollte Google etwa bald mehr Daten
auswerten als die Links aus Webseiten? Vielleicht sogar Volltexte,
Bilderkennung, Gesichtserkennung, Logfileanalyse, Usertracking, ... ??
Welch spannende Zukunft."
</ironie aus>
"Halt wir sind ja schon im Jahr 2016. Das ist keine Zukunft sondern
kalter Kaffee, Oder?"
(vgl. 2011, Eli Pariser: Beware online "filter bubbles"
https://www.youtube.com/watch?v=B8ofWFx525s )
Darüber hinaus werden mittlerweile nicht mehr nur Fundstellen gelistet,
sondern Wissen extrahiert.
Hier kommt jetzt die Gegenwart von 'Watson', 'Siri', 'OK Google' und
'Alexa'.
Listeninformationen unter http://www.inetbib.de.