[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Mehr als 100 deutsche Repositories in BASE / NeueFeatures im BASE Lab
- Date: Thu, 12 Jul 2007 14:41:32 +0200
- From: Dirk Pieper <dirk.pieper@xxxxxxxxxxxxxxxx>
- Subject: Re: [InetBib] Mehr als 100 deutsche Repositories in BASE / NeueFeatures im BASE Lab
Lieber Herr Kalok,
Am Mittwoch, 11. Juli 2007 15:37 schrieb Lothar Kalok:
Lieber Herr Pieper,
zu den von Ihnen genannten beeindruckenden Zahlen: gibt es
eine Abschaetzung, wie viele der Dokumente sind tatsaechlich
frei zugaenglich sind?
Mit Ihrer Frage sprechen Sie ein wichtiges Problem an, das auch im
DRIVER-Umfeld diskutiert wird und dazu geführt hat, dass in den
DRIVER-Guidelines
http://www.driver-support.eu/documents/DRIVER_guidelines_1%200.pdf
von den OAI-Data-Providern, eine Set-Definition gefordert wird, die die
Unterscheidung z.B. in frei zugängliche und nicht frei zugängliche
Dokumente erlaubt, damit von OAI-Service-Providern gefiltert werden kann.
Es kommt auch vor, dass Provider ihre Politik nachträglich ändern, d.h.
dass Dokumente auf einmal frei zugänglich sind, die es vorher nicht waren,
oder umgekehrt. Das bekommen wir sicherlich nicht in jedem Fall mit und
schon gar nicht, wenn keine entsprechende Set-Definition vorhanden ist.
Aus BASE-Sicht einige Beispiele, die zeigen sollen, dass wir uns mit dem
Problem beschäftigen. Das ist übrigens auch eine Erklärung dafür, warum
wir im Vergleich zu OAISTER oder scientificcommons.org weniger Quellen
und Dokumente im Index haben, weil wir versuchen, Provider, die
ausschließlich Metadaten oder ausschließlich nicht frei zugängliche
Dokumente anbieten, nicht in BASE aufzunehmen. Das kann sich aber, wie
gesagt, immer ändern, und wie soll man mit unterschiedlichen Anteilen von
frei und nicht frei zugänglichen Dokumenten in einem Respository umgehen,
wenn es keine Selektionsmöglichkeit gibt?
Hier ein paar Beispiele:
Die Fraunhofer-Gesellschaft bietet Fraunhofer-Publica und
Fraunhofer-Eprints an, in Publica sind (auch) reine Nachweisdaten drin
(das ist ja auch völlig ok, die wollen/müssen möglichst sämtliche - auch
kostenpflichtige - Publikationen ihrer Einrichtung nachweisen), nur in
Fraunhofer-Eprints kommen Sie immer direkt auf den Volltext. In
openarchives finden Sie natürlich beide OAI-Schnittstellen.
Von ca. 120 digizeitschriften sind z.Zt. rund 60 frei zugänglich. Anhand
der Set-Definition ist eine Unterscheidung auf Dokument-Ebene in frei
zugängliche und nicht frei zugängliche Dokumente möglich, so dass man aus
digizeitschriften in BASE zwei Collections machen könnte, eine mit den
frei zugänglichen und eine mit den nicht frei zugänglichen Dokumenten. Man
kann auch die nicht frei zugänglichen gar nicht indexieren, es gibt
vielleicht auch Nutzer in Institutionen, die Zugriff auf die lizenzierten
Inhalte haben und erwarten, diese auch in BASE zu finden, ...
Dann gibt es natürlich das Problem, dass es zu den Metadaten keine
Volltexte gibt oder der Zugang z.B. auf einen Campus beschränkt bleibt.
Ein zufällig gewähltes Beispiel:
http://hdl.handle.net/2003/5924
Was soll man damit machen?
Fazit:
Sich nur auf frei zugängliche Volltexte zu beschränken ist schwer, in
vielen Fällen wird dies in den Daten nicht angezeigt. Wir können uns nur
im Vorfeld die Quelle anschauen, aber auch dort kann sich die Politik
nachträglich ändern. Ich kann z.Zt. nicht sagen, wie hoch der Anteil von
nicht frei zugänglichen Dokumenten in BASE ist, deshalb steht in unseren
Texten auch immer "überwiegend frei zugänglich".
Das Ganze ist vielleicht ein schönes Thema für eine unserer nächsten
Publikationen.
Viele Grüße
Dirk Pieper
Listeninformationen unter http://www.inetbib.de.