[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Suchmaschine BASE (war: Re: Open Access: Neues Buchprojekt des IBI Berlin)



Hallo Herr Wolf,

ich danke Ihnen für die Klarstellung. Sie ist hilfreich für jeden, der - 
der Forderung nach Open Access folgend - seine Dateien dafür freigibt, 
dessen Part jedoch nicht darin besteht, die OAI-Metadaten selbst zu 
produzieren.

Andererseits ist sollten unsere Kritik und Ihre Replik helfen, bewusst 
zu machen, zu welchen Konsequenzen die OAI-Metadaten letztlich führen 
und dass an dieser Schnittstelle gearbeitet werden muss.

Von Herausgeberseite haben wir bei unserem jüngsten Projekt versucht, 
dem Problem zu begegnen, indem wir jedem einzelnen Dokument des 
Sammelbandes im Klartext die bibliographischen Daten beigegeben haben.
Das hilft zwar noch nicht bei der Recherche in BASE, es hilft aber dem 
Endnutzer, das gefundene Dokument richtig zuzuordnen, vgl. 
http://edoc.hu-berlin.de/e_suche/oai-hu.php

Sorry für die späte Antwort, bedingt durch Abwesenheit.
Freundliche Grüße
Petra Hauke



Am 28.02.2011 14:41, schrieb Sebastian Wolf:
Hallo Frau Hauke. liebe Liste,

am 15.2. wiesen sie hier in der Liste u.a. auf folgende Publikation hin:

* (3) Hauke, P., Rumler, J.,&  Hötzeldt, A. (2010). Open Access --
nutzerfreundlich!? -- Nachweise paralleler Druck- und
Online-Ausgaben in Bibliothekskatalogen und
Dokumenten-Suchmaschinen. In: ABI-Technik, H. 3, S. 174-181. Als
Preprint online mit Open Access unter
http://edoc.hu-berlin.de/docviews/abstract.php?lang=ger&id=37407
In dem oben genannten Artikel wird auch BASE (S. 17-19) erwähnt, was uns
natürlich sehr freut. Leider werden aber viele Dinge nicht richtig
wiedergegeben. Daher erlaube ich mir, hier in der Liste auf die Aussagen
in dem Artikel einzugehen.

Die Metasuchmaschine BASE, betrieben von der Universitätsbibliothek
Bielefeld, ist spezialisiert auf frei im Sinne des Open Access
zugängliche wissenschaftliche Dokumente im Internet.
BASE ist keine Metasuchmaschine. BASE hat zwar Dokumente aus über 1.700
Quellen indexiert, allerdings befinden sich alle indexierten Daten in
einem Index auf unseren Servern. Eine Metasuchmaschine besitzt keinen
eigenen Index, sondern leitet Suchanfragen an andere Suchmaschine weiter
und stellt die zurückgemeldeten Ergebnisse unter einer Oberfläche
zusammen. Ein Beispiel für eine Metasuchmaschine ist Metager. Ich hätte
erwartet, dass diese Grundlagen der Funktionsweise von Suchdiensten im
Bereich der Bibliotheks- und Informationswissenschaft bekannt sind.

Nun zu den konkreten Aussagen:

Zum besseren Verständnis hier die Trefferliste aus BASE mit den 2
im Artikel genannten Dokumenten:
http://www.base-search.net/index.php?q="Bibliotheken+bauen+und+ausstatten";

Für den Titel „Bibliotheken bauen und ausstatten“ sind beide
Versionen nachgewiesen, allerdings unterschiedlich beschrieben,
indexiert und annotiert.
So findet sich im zweiten Treffer ein falscher Titelzusatz
Bibliotheksbau.
Der "falsche" Titelzusatz steht genau so auf dem Dokumentenserver der HU
Berlin:

http://edoc.hu-berlin.de/docviews/abstract.php?lang=ger&id=30189

Dort ist er in Klammern angegeben (offenbar eine ungezählte Serie).
Entscheidend für die Anzeige in der BASE-Trefferliste sind allerdings
sowieso nur die OAI-Metadaten, denn nur diese indexieren wir. Der
OAI-Metadatensatz ist hier zu finden:

http://edoc.hu-berlin.de/OAI-2.0?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:HUBerlin.de:30189

Hier findet sich u.a. folgender Eintrag:

<dc:title>Bibliotheken bauen und ausstatten</dc:title>
<dc:title>Bibliotheksbau</dc:title>

Bibliotheksbau ist als einer von zwei Titeln gekennzeichnet, daher
zeigen wir ihn korrekterweise in unserer Trefferliste an. Mehrmalige
Vorkommen eines Feldes, z.B. Titel oder Autor werden von uns immer durch
Semikolon abgetrennt.

Als Verlag ist einmal angegeben „Philosophische Fakultät I“, beim
zweiten Treffer „Institut für Bibliotheks- und
Informationswissenschaft“. Tatsächlich ist die Druckausgabe im ,
Verlag Bock + Herchen erschienen, das Buch ist Ergebnis eines
Projektseminars des Instituts für Bibliotheks- und
Informationswissenschaft der Humboldt-Universität zu Berlin, dort
angesiedelt bei der Philosophischen Fakultät I.
Die Angaben zum Verlag findet man zwar auf der Weboberfläche, aber nicht
in den OAI-Metadaten.

Im 1. Datensatz findet man die Angabe:

<dc:publisher>
Institut für Bibliotheks- und Informationswissenschaft
</dc:publisher>

Im 2. Datensatz - siehe
http://edoc.hu-berlin.de/OAI-2.0?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:HUBerlin.de:30080
- findet man die Angabe:

<dc:publisher>
Philosophische Fakultät I
</dc:publisher>

Folglich werden die Daten auch genau so in BASE angezeigt.

Der erste Treffer enthält unter dem Stichwort „Inhalt“ noch eine
Abschrift des Klappentextes, die beim zweiten Treffer fehlt.
Auch das ist in den (unvollständigen) OAI-Metadaten begründet.

Während beim ersten Treffer zwar nicht die Herausgeber, dafür jedoch
beteiligte Autoren übernommen wurden (soweit bei der Archivierung auf
dem edoc-Server die beschränkte Eingabemaske für den Gesamt-PDF einer
Open Access Publikation sie zugelassen hatte, daher unvollständig),
fehlt beim zweiten Treffer jegliche Namensnennung, auch die der
beiden Herausgeber.
Hier ist unsere Indexierung in der Tat bisher unvollständig, da die
Einträge im Feld<dc:contributor>  noch nicht suchbar sind und nicht
angezeigt werden. Dies werden wir noch ergänzen.

Nachweis der von diesem Herausgeber in seiner zusätzlichen
Eigenschaft als Autor in diesem Band vertretenen Aufsätze sowie des
Vorwortes
...
allerdings ist weder aus dem Nachweis noch aus dem PDF selbst
erkennbar, mit welcher Publikation diese Texte in Verbindung zu
bringen sind.
Da diese Daten an keiner Stelle in den OAI-Metadaten zu finden sind.

So beeindruckend die Menge von mehr als 20 Mio. Nachweisen in BASE
sein mag – der rudimentäre Nachweis einzelner Fragmente ohne Bezug zu
ihrem Zusammenhang ist weder nutzerfreundlich noch zitierfähig.
Die genannten Kritikpunkte fallen - bis auf die nicht angezeigten
Herausgeber - in diesem Fall auf unvollständige OAI-Metadaten aus der HU
Berlin zurück. Dies gilt im übrigen so auch in fast allen anderen
Fällen, in denen wir mit Fehlern konfrontiert werden.

Die Forderung nach korrekter und vollständiger Anzeige von Metadaten ist
gut und richtig - dies ist auch unser Anspruch, aber hier sind in erster
Linie die Datenlieferanten gefragt.

Wir versuchen zwar möglichst viele Fehler in den Quelldaten zu beheben,
soweit dies mit vertretbarem Aufwand möglich ist (z.B. Korrekturen in
den "identifiern"), aber aus einer "schlechten" oder unvollständigen
Datenquelle einen perfekten und korrekten Datensatz zu machen,
übersteigt dann leider auch unsere Fähigkeiten.

Viele Grüße

Sebastian Wolf


-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.