[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] Semantik, Google und die Ev. Gemeinde



Hier noch aus dem Blog-impressum:

"
Die Internetsuchmaschine Semager findet Internetseiten, die dem
Gesuchten entsprechen aber nicht zwingend die Suchbegriffe enthalten.
Ebenso kann die Suche verwendet werden um verwandte und ähnliche
Wörter ausfindig zu machen und ist der Funktion eines Thesaurus somit
nicht unähnlich.

Im Gegensatz zur Volltextsuchmaschine bei der nur exakt die eingegeben
Suchbegriffe gefunden werden, verfolgt Semager den Ansatz stark
verwandte Suchbegriffe in die Suchergebnisse mit einzubeziehen.
"

Spannend.

Und die Geschwindigkeit, mit der Google das visible web in den eigenen
index aufnimmt ist atemberaubend. Und bei der hier diskutierten Suche,
kommt nach der katholischen Kirche nun nicht mehr die evangelische
Kirche, sondern dank Wolfgang u.a. nun gleich dieser inetbib-thread.

Und ergänzend zu Sebastians Ausführungen (Danke für die!) noch ein
pragmatischer Tipp für die Recherche per Google, da Herr Umstätter ja
die boole'schen Operatoren ansprach: -
Dieses schlichte Zeichen vor ein Wort, und weg sind sie, die kath. miss hits.
(Hätte H. Luther sicher auch gefallen ;)

Noch ganz was anderes, da die proprint story ja nicht gross
interessiert: heute ist der Geburtstag von Clara E. Müller, die dank
Google und Co. recht einfach im web zu finden ist.

MfG, Karl Dietz
www.karldietz.de


On 11/7/08, Walther Umstaetter <h0228kdm@xxxxxxxxxxxxxxx> wrote:
Ds war doch schon recht erhellend.
Uebrigens, unter den Treffern bei "evangelische gemeinde neustadt"
findet man auch schon diese Diskussion hier, und unter
http://www.semager.de/blog/2008/11/06/semantische-katholiken/
den Hinweis:
"Semantische Katholiken
      06.Nov 2008
Mal ganz ehrlich, wenn man nach evangelische gemeinde neustadt bei
Google sucht und stattdessen die katholische Kirche findet, kann doch
etwas nicht stimmen.

Ich vermute mal ganz stark, dass Google nun auch vermehrt Semantik in
die Suchergebnisse mit einbezieht, zumal der Begriff ìevanglischî
unter den ersten beiden Treffern auf deren Homepage nicht ein einziges
Mal vorkommt. Und das hier Jemand eine Google-Bombe gelegt hat, kann
ich mir ehrlich gesagt auch nicht vorstellen.
Bleibt nur ¸brig, dass Google eine semantische N‰he von evangelisch zu
katholisch berechnet hat."

Das vermute ich auch.

Ausserdem duerfte beim Ranking der Umfang der Dokumente wichtig sein.
Ein Dokument, dass nur aus den Worten evangelische gemeinde neustadt
besteht,
erscheint eher, als eines das unter hunderten von Worten auch diese
drei enthaelt.

MfG

W. Umstaetter


On Nov 7, 2008, at 9:31 AM, Sebastian Wolf wrote:

Liebe Inetbibler,

Walther Umstaetter schrieb:

"evangelische Gemeinde Neustadt" mit nur 155 Treffern (Gänsefüßchen

"evangelische Kirchengemeinde Neustadt" 242 Treffer.

"evangelische Kirchengemeinde Neustadt" OR "evangelische Gemeinde
Neustadt" nur 144

Bei Google scheint man Boolesche Logik nicht zu kennen ;-)

Doch, Google kennt sie und sie ist auch korrekt, aber ALLE
Trefferzahlen bei Google (und das gilt natürlich auch für Yahoo, MSN
usw.) sind reine Schätzwerte, noch weniger Wert als Hochrechnungen.
Diese Schätzwerte können sich für identische Suchanfragen
unterschieden, je nachdem, wann man von wo auf die Suchmaschine
zugreift.

Die tatsächliche Trefferzahl erhalt man nur, wenn man sich bis zur
letzten Trefferseite durchklickt (das geht nur bei max. 1000
Treffern, dann auf den Link "die Suche unter Einbeziehung der
übersprungenen Ergebnisse wiederholen" und sich dann noch einmal bis
zum letzten Treffer durchklickt). Dann - und nur dann - sieht man
die in dieser Sekunde gültige Trefferzahl.

Die so von mir ermittelte tatsächliche Trefferzahl bei den genannten
Anfragen ist:

1a) "evangelische gemeinde neustadt" = 75
1b) "evangelische Gemeinde Neustadt" = 74 (ich suche jetzt nicht den
1 Treffer, der hier nicht angezeigt wird)

2a) "evangelische Kirchengemeinde Neustadt" = 83
2b) "evangelische kirchengemeinde neustadt" = 83

3a) "evangelische Kirchengemeinde Neustadt" OR "evangelische Gemeinde
Neustadt" = 106
3b) "evangelische kirchengemeinde neustadt" OR "evangelische gemeinde
neustadt" = 106

Sieht für mich alles bestens aus, bis auf den einen fehlenden
Treffer bei Anfrage 1b, aber damit kann man leben.

Durchaus hilfreicht ist es bei Google übrigens die erweiterte Suche
zu benutzen. In der englischsprachigen erweiterten Suche von Google
sieht man dazu noch sofort, wie der Suchstring aussieht, wenn man
Suchbegriffe in verschieden Suchfelder eingibt. Eine sehr schöne
Sache und z.B. in Schulungen sehr anschaulich.

Mir ist bei meinen Tests aufgefallen, dass die Ergebnisse bei Google
immer noch am konsistentesten von allen allgemeinen Suchmaschinen
sind. Knapp dahinter folgt Yahoo. Den Rest an allgemeinen (!)
Suchmaschinen - von MSN, Ask und wie sie alle heißen - kann man
getrost vergessen. Die Indexe sind viel zu klein und inkonsistent.

Alternativen zu Google gibt es aus meiner Sicht keine, nur
Ergänzungen - und da sind vor allem Spezialsuchmaschinen zu nennen,
z.B. für wissenschaftliche Seiten (Google Scholar, Scirus, unsere
eigene Suchmaschine BASE) und für tausend andere Dinge. Ein paar
davon habe ich in meinem Suchmaschinen-Tutorial aufgelistet:
http://www.ub.uni-bielefeld.de/biblio/search/services/
services_main.htm

Viele Grüße

Sebastian Wolf

--
Sebastian Wolf : sebastian.wolf@xxxxxxxxxxxxxxxx
Uni-Bibliothek Bielefeld, Abt. Elektronische Dienstleistungen
Tel.:      +49 521 1064044
Website:   http://www.ub.uni-bielefeld.de/
Bookmarks: http://del.icio.us/bibliothekswelt/
Feeds:     http://www.bloglines.com/public/bibliothekswelt/

+++ Welcome to the 9th International Bielefeld Conference,
3 - 5 February 2009, http://conference.ub.uni-bielefeld.de +++






Listeninformationen unter http://www.inetbib.de.