[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Nachtrag: Suchformular zu "Das ungenutzte Potential von Standard-Suchmaschinen wie Google"

Date: Wed, 17 Jun 2009 13:20:33 +0200
From: Sebastian Wolf <sebastian.wolf@xxxxxxxxxxxxxxxx>
Subject: Re: [InetBib] Nachtrag: Suchformular zu "Das ungenutzte Potential von Standard-Suchmaschinen wie Google"

Hallo Herr Bewersdorff, liebe Liste,

Jörg Bewersdorff schrieb:

Für Interessenten habe ich das Google-Formular für ein paar Tage unter
http://www.bibliothek-pc.de/google.htm


Vielen Dank. Nun habe ich auch ein Beispiel gefunden, in der der der 
Volltext (PDF) eines von uns lizenzierten Springer-E-Books von Google 
komplett indexiert wurde. Beim Abruf des Treffers erhält man dann 
allerdings ggf. den Hinweis "Zugriff nur für Abonnenten", wenn man den 
Titel nicht lizenziert hat.

Ich gehe davon aus, dass die entsprechenden Content-Provider wie
Springer, Elsevier, Wiley, ..."einfach" die IP bzw. IPs des
Goolgebots nach "Herzenslust" durchsuchen lassen (die Browserkennung
auf Googlebot zu stellen reicht natürlich nicht!). Das heißt, der

Ja, so wird es sein. Dass Google Scholar so verfährt, dürfte bekannt
sein. Bisher war ich aber davon ausgegangen, dass es eine strikte
Trennung zwischen Google Scholar und Google gibt, aber vermutlich wurden
auch Dokumente, die schon im Rahmen von Google Scholar indexiert wurden,
in den allgemeinen Google-Index aufgeonmmen. Dies sieht man auch daran,
dass bei den E-Book-Treffern bei Google die aus Google Scholar bekannte
Trefferanzeige mit Anzahl der Zitate und Versionen erscheint, zudem
Autor und Erscheinungsjahr. Allerdings frage mich, wieso es immer noch
Unterschiede gibt zwischen Google und Google Scholar.

Beispiel. Die Suche nach
fünfdimensionale relativitätstheorie site:springerlink.com filetype:pdf
ergibt bei Google 5 Treffer, bei Google Scholar 7.

1 Treffer aus Google (der immerhin laut Google 162 mal zitiert wurde),
ist nicht bei Google Scholar nachgewiesen. Umgekehrt sind 3 Treffer aus
Google Scholar nicht bei Google nachgewiesen.

Vergleich der Trefferlisten:
http://www.google.com/search?q=f%C3%BCnfdimensionale+relativit%C3%A4tstheorie+site%3Aspringerlink.com+filetype%3Apdf
http://scholar.google.com/scholar?q=f%C3%BCnfdimensionale+relativit%C3%A4tstheorie+site%3Aspringerlink.com+filetype%3Apdf

Schon etwas merkwürdig. Sollte Google doch alles doppelt indexieren,
einmal für Google allgemein und einmal für Google Scholar? Das wäre doch
ziemlich unwirtschaftlich.

Yahoo und Bing verweisen bei einer Suche nach Titeln von
Springer-E-Books übrigens nur auf die allgemeinen Infoseiten von
Springer.com, von wo es lediglich die Möglichkeit gibt, das Buch zu
kaufen. Dass Google hier viel mehr indexiert, wird auch bei den
Trefferzahlen deutlich, auch wenn diese natürlich immer nur eine grobe
Tendenz liefern. Eine Site-Suche nach "springerlink.com" bzw. eine
zusätzliche Einschränkung auf PDFs ergibt bei:

Google: 4,5 Mio. Seiten (3,7 Mio. PDFs)
Bing: 27.000 Seiten (0 PDFs)
Yahoo: 7.000 Seiten (0 PDFs)

Google eignet sich also immer besser auch für die wissenschaftliche
Literatursuche. Problematisch ist allerdings, dass die wiss. Dokumente
bei einer allgemeinen Suche in der Masse der Treffer untergehen, zumal
die indexierten Volltexte meist ein Page Rank von 0 haben und damit eher
am Ende einer Trefferliste zu finden sind.

Viele Grüße

Sebastian Wolf

--
Sebastian Wolf : sebastian.wolf@xxxxxxxxxxxxxxxx
Uni-Bibliothek Bielefeld, Abt. Elektronische Dienstleistungen
Tel.: +49 521 1064044
Website: http://www.ub.uni-bielefeld.de/
Bookmarks: http://del.icio.us/bibliothekswelt/
Feeds: http://www.bloglines.com/public/bibliothekswelt/

--
http://www.inetbib.de

Follow-Ups:
- [InetBib] Re**2 "Das ungenutzte Potential von Standard-Suchmaschinen wie Google"
  - From: Jörg Bewersdorff

References:
- Re: [InetBib] Bing ist online. -- Das ungenutzte Potential von Standard-Suchmaschinen wie Google
  - From: Jörg Bewersdorff
- Re: [InetBib] Bing ist online. -- Das ungenutzte Potential von Standard-Suchmaschinen wie Google
  - From: Sebastian Wolf
- [InetBib] Nachtrag: Suchformular zu "Das ungenutzte Potential von Standard-Suchmaschinen wie Google"
  - From: Jörg Bewersdorff

Prev by Date: [InetBib] Nochmals: Lizenzpflichtige Inhalte bei Google
Next by Date: [InetBib] USB-Stick und § 52b UrhG
Previous by thread: [InetBib] Nachtrag: Suchformular zu "Das ungenutzte Potential von Standard-Suchmaschinen wie Google"
Next by thread: [InetBib] Re**2 "Das ungenutzte Potential von Standard-Suchmaschinen wie Google"
Index(es):
- Date
- Thread

Listeninformationen unter http://www.inetbib.de.