[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Aufsatzdienste (Tuebingen) als Geldverschwendung - war mal: Docster



Auch das ist "Ein richtig typischer Graf!"

Das Problem ist, dass Herr Graf in diesem Punkt (Digitalisierung von nachgefragtem Bibliotheksmaterial)
teilweise zurecht fragt, warum wir in deutschen Bibliotheken bereits digitaliserte Dokumente nicht archivieren.


Die Frage ist alt, und ergab sich schon beim Aufbau von JASON Anfang der 90er Jahre.
Damals hätte man aus meiner Sicht schon allein zu Forschungszwecken alle gescannten Dokumente speichern können,
wir hatten unseren CDR-Schreiber in Köln dafür angeboten.


Es gibt mehrere Gründe, warum wir in Deutschland nicht ausreichend digital archivieren,
dass es trotzdem notwednig wäre ist aus meiner sicht richtig.
Auch für das Verlagswesen wäre es interessant zu prüfen, was wie oft publizierte Dokumente wiederholt gebraucht werden.
Die großen Verlage wissen natürlich aus dem ADONIS-Projekt, wie wenig,
bezogen auf die Massen die eine Bibliothek täglich erwirbt, kopiert wird.
Wir wissen es aber auch, weil sich solche Modelle leicht abschätzen lassen, und für eine erfolgreiche Informationspolitik.
ist es wichtig, dass sie auf Tatsachen fußt. Das gilt für die Verlage, die Bibliotheken und nicht zuletzt für die gesamte
Nationalökonomie des Geistes (Harnack).


Um die Frage zu PDF, TIFF etc. zu beantworten, so sehe ich grundsätzlich keinen Zusammenhang zwischen
Nutzerdaten und dem digitalisierten Dokument. Wenn die wirklich irgendwo verknüpft sind,
muss man diese Verknüpfung auch lösen können.


Zu den Speicherkosten ist zu sagen, dass eine Digitalisierung heute so viel teurer ist als die Speicherkosten,
dass dieses Argument eher in Richtung einer Speicherung zielt - auch wenn von hundert gespeicherten Dokumenten nur eins
erneut gebraucht würde.
Geht man von 5 MB (gepackter Daten) pro Dokument aus, so fasst eine CD-R für 50 Cent 100 solcher Dokumente.
Wenn diese CD-ROM in 10 Jahren nur einmal gebraucht wird, kann man sie bei Bedarf aus dem Regal nehmen
und in ein im Internet ansprechbares Laufwerk legen. Bei öfterem Gebrauch kommt eine Kopie auf einen Sever.


Selbstverständlich kann man dafür auch sehr viel genauere und komplexere Modelle durchrechnen.
Die Tatsache, dass die Dokumente angefordert wurden, erhöht die Wahrscheinlichkeit eines erneuten Bedarfs
allen anderen solchen Dokumenten gegenüber erheblich.


Darum wäre ein solches Verfahren den flächendeckenden Digitalisierungen
(Motto: Jetzt archivieren wir mal unser ganzes Magazin. s. Dieter E. Zimmer) aus ökonomischen Gründen vorzuziehen.
Dass hat nichts damit zu tun, dass es zeitweilig sinnvoll ist bestimmte Bestände komplett zu digitalisieren.


Die Tatsache, dass Bibliotheken publizierte Information haben, und damit alle Bibliotheken dieser Welt sich an der Digitalisierung
beteiligen können, zeigt wie irreführend es ist, wenn man so tut als müsste jede Bibliothek ihren Bestand digitalisieren.
Wenn ein durchschnittliches publiziertes Dokument in 100 Bibliotheken dieser Welt zu finden ist, dann sinken die Kosten,
auf die einzelne Bibliothek bezogen um den Faktor 100.


Wenn also manche Hypothetiker behaupten (denn hier handelt es sich nicht um eine Theorie, sondern um eine zu falsifizierende Hypothese)
eine Bibliothek müsste beispielsweise ihren Erwerbungsetat 50 Jahre lang zur Digitalisierung einsetzen, so geht dies an der Realität völlig vorbei.


Eine Datenbank, in der alle digitalisierten Dokumente verzeichnet werden (das könnte beim speichern
weitgehend automatisch geschehen), erhöht die Wahrscheinlichkeit eines weiteren Abrufs stark, wie man bei den
Bell Labs vor etwa zwanzig Jahren beobachtet hat.


Dass eine solche Datenbank (s. RLIN etc.) genutzt werden muss ist klar.

Der Vorschlag, man koennte Dokumente über "eine Mail mit bibliographischen Daten" abrufen erscheint mir nicht besonders zeitgemäß, wenn ich in einer Datenbank die Möglichkeit des direkten online delivery habe.

Die Qualitaet ist ein FAQ in diesem Zusammenahang, aber aus bibliothekarischer Sicht kein wirkliches Problem.
Während Rechenzentren sich wiederholt mit Fragen der Authentizität, der Datensicherheit, etc. beschäftigen,
sollte man unter bibliothekarischer Sicht ein digital verfügbares publiziertes Dokument nicht nur einmal im internet anbieten. Es ist ein merkwürdiges Phänomen, dass die meisten Menschen glauben, dass digitale Dokumente viel anfälliger hinsichtlich der Fälschung, Zersörung und des Verlustes sind, sie aber gleichzeitig solche Dokumente nur singulär archivieren möchten. Bei gedruckten Dokumenten haben wir grob gerechnet 100 Sicherheitskopien in den Bibliotheken dieser Welt, und sehen Jahr für Jahr verluste, durch Hochwasser, Kriege, Brände, Diebstahl,
etc. Es wäre ein fundamentaler Fehler, wenn wir eine digitale Publikation nicht mehrfach an verschiedenen Stellen der Welt, auch in verschiedenen Qualitäten und Speicherformen (je nach Bedarf) archivieren würden.


Wenn ein Dokument in unzureichender Qualität digitalisert wurde und der Bedarf es erforderlich macht, dann digitalisieren wir es noch einmal aufwendiger - wo ist das Problem?


MfG


Umstätter

Klaus Graf schrieb:

Das deutsche Bibliothekswesen ist offenbar so eingerichtet, dass im
digitalen Bereich maximale Ineffizienz angestrebt wird ...

Schon vor laengerer Zeit habe ich hier mehrfach und ohne jeden Erfolg
dafuer plaediert, urheberrechtlich nicht mehr geschuetzte Aufsaetze, die
in einer Bibliothek fuer einen Benutzer (z.B. fuer den Fernleihversand
oder fuer SUBITO) gescannt werden, in dezentralen digitalen Bibliotheken
einzustellen, damit jegliche Doppelerfassung vermieden wird und die
Aufsaetze der wiss. Oeffentlichkeit zur Verfuegung stehen.

An sich eine gute Idee, werden viele denken. Aber nicht die BeamtInnen
in deutschen Hochschulbibliotheken: Ich wandte mich neulich an die
Sachbearbeiterin fuer den Tuebinger Aufsatzdienst

http://www.uni-tuebingen.de/ub/serv/tad.htm

mit der Bitte, sicherzustellen "dass vor 1900 erschienene und daher fast
immer urheberrechtlich nicht mehr geschuetzte Aufsaetze, wenn diese denn
ueber Sie bestellt werden, NICHT geloescht, sondern in einer digitalen
Bibliothek fuer den freien WWW-Zugang dauerhaft bereitgehalten werden"

Erstes Gegenargument:
Das gehe aus Datenschutzgruenden nicht, die Daten seien ja mit den
Nutzerdaten verknuepft.

Laecherlich! Das mag fuer die PDFs zutreffen, aber doch nicht fuer die
gescannten TIFFs.

BTW: Weiss jemand, ob man irgendwie (am besten einfach) aus einem PDF
eine Bilddatei extrahieren kann?

Zweites Gegenargument:
Man haette fuer einen solchen Service keine Mittel.

Der miese Egoismus und das provinzielle Wesen der deutschen
Hochschulbibliotheken wird an dieser Erwiderung besonders deutlich.
Waeren sie effizient organisiert, so koennten genauso automatisiert wie
der kostenlose Versand von Artikeln an Hochschulangehoerige, der die UB
zur zentralen Kopierstelle der Universitaet macht, die Scans mit den
bibliographischen Daten verknuepft und in die oertliche Digitale
Bibliothek eingebracht werden.

Wo sollen hier finanzielle Huerden liegen?

Vermutlich koennte man das Verfahren soweit automatisieren, dass man
eine Mailadresse z.B. input _at__ docster.de einrichten koennte, an die eine
Mail mit bibliographischen Daten (es muesste jeweils nur der Titel und
die Seitenzahl nachgetragen werden, Zeitschriftentitel und Jg. sind
bereits vorgegeben) und PDF-Anhang (ohne Nutzerdaten) oder TIFF-Anhang
gesandt werden koennte, und der Upload in den Archivserver und die
Einstellung in die Artikeldatenbank wuerde ohne weiteres Zutun erfolgen.

Urheberrecht: Wenn man nicht im Einzelfall die Lebensdaten des Autors
ermitteln moechte, kann man 1900 oder 1880 als Stichjahr nehmen. Das
Risiko, dass eine UB Aerger bekaeme, ist verschwindend gering.

Beliebigkeit: Gewiss ist das eine beliebige Auswahl an aelteren
Artikeln, aber ist nicht auch VOELLIG beliebig, was z.B. Wolfenbuettel
an alten Buechern digitalisiert?

Qualitaet: Die gedruckten Texte sollen fuer den Benutzer ja lesbar sein,
und das sind die via Mail von Bibliotheken versandten Scans ja in der
Regel. Man muss sich nur mal anschauen, welche extrem schlechte
Digitalisierungsqualitaet bei der Digitalisierung von Mikrofilmen (z.B.
der Moerin) Wolfenbuettel via GBV offeriert, dann wird auch ein solches
Argument hinfaellig.

Klaus Graf
--
http://log.netbib.de mit taeglichem Jean-Paul-Zitat







Listeninformationen unter http://www.inetbib.de.