[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Deutsche digitale Bibliotheken



Hallo Herr Aronsson,

Lars Aronsson wrote:


Wieviel deutschsprachige Literatur (Bücher und Zeitschriften) ist
bisher retrospektiv digitalisiert geworden, wo kann man es finden, und
welche Anzahl von Benutzern haben diese Sammlungen?  Gibt es irgendwo
eine Übersicht, Zusammenfassung, Auswertung?


Meines Wissens gibt es keine Übersichten oder Statistiken, die sämtliche Projekte mit den von Ihnen genannten Daten liefern.
Das GDZ hält eine Liste der DFG-geförderten Digitalisierungsprojekte bereit, sofern sie uns denn gemeldet werden. Diese Liste wird auch noch weiterhin gepflegt.


<http://gdz.sub.uni-goettingen.de/en/vdf-e/vdf-liste-e.shtml>
Auf der Homepage des GDZ <http://gdz.sub.uni-goettingen.de> den Menupunkt "DFG-Projects" auswählen.



So etwa könnte vielleicht ein Vergleich aussehen, aber mit mehr
Projekte:


Ich darf einige Angaben zum GDZ korrigieren bzw. ergänzen, ja?


                     Projekt Gutenberg-DE   GDZ
Gegründet             1994                  1996?


1997 - siehe auch <http://gdz.sub.uni-goettingen.de/en/main/background-e.shtml>


Förderung             Kein?                 DFG, SUB Göttingen
Preis                 Kostenlos             Kostenlos
Lizenz                Urheberrechtsfrei     ? *


Auf dem Server des GDZ befinden sich digitale Dokumente mehrere Projekte. In einigen dieser Projekte wurde unter anderem auch urheberrechtsgeschütztes Material gescannt und online gestellt - dies betrifft überwiegend die Kollektion "Mathematica".


Faksimile             Nein                  Ja
Druckbar              Ja (HTML)             Ja (PDF)
Google indexiert      Ja                    Nein
OCR Volltext suchbar  Nein                  Ja (unvollständig?)

Es existiert nur ein so kleiner Teil in Volltext, dass dieser eigentlich nur zu Demonstrationszwecke dient. Ich würde daher obige Spalte nicht unbedingt mit "ja" beantworten.
Zur Zeit wird versucht, einige Dokumente aus einigen Kollektionen auch im Volltext anzubieten. Aus Kostengründen wird vermutlich niemals der komplette Bestand des Dokumentenservers im Volltext angeboten werden können.
Ebenso aus Kostengründen ist bislang eine Erfassung des Volltextes gescheitert.


Tief linkbar Ja Nein **

Wir arbeiten dran :-)


Suche linkbar         Nein                  Ja ***
Open source           Ja                    Nein ****

Kurze Anmerkung: Die PDFs enthalten die Images in voller Auflösung (bspw. bitonal 600dpi). Das macht unserer Ansicht nach mehr Sinn, als die einzelnen Images als TIFF in derselben Auflösung auszuliefern. Ein Informationsverlust bei der Konvertierung in PDF tritt also nicht auf.

Bei den 600dpi TIFFs, die den PDFs zugrunde liegen,handelt es sich jedoch NICHT um die originalen Scanner-Dateien, sondern um nachträglich optimierte Images. Gerade bei älteren Werken ist dies erforderlich und erhöht die Lesbarkeit ganz erheblich.

Genre Belletristik Naturwissenschaften

Der Dokumentenserver des GDZ enthält Dokumente verschiedenster Digitalisierungsprojekte, die verschiedene fachliche Schwerpunkte haben/hatten. Der Bereich Mathematica ist für sich genommen sicherlich der grösste Bereich, macht aber zur Zeit gerade mal die Hälfte aller Dokumente aus. Weitere Kollektionen mit hoher Anzahl an Dokumenten sind bspw. die Reisebeschreibungen (Itineraria) und die Wissenschaftsgeschichte (History of the Humanities and Sciences).

Naturwissenschaften beschreibt also den Inhalt des Dokumentenservers nur zur Hälfte.

Anzahl Bände/Werke    400                   3386
Anzahl Textseiten     ?                     1,3 Mio
Anzahl Benutzer       ?                     ?

Die Benutzerzahl können wir nicht nachliefern, da wir weder ein Tracking durchführen noch eine Benutzeranmeldung durchführen. Bei Interesse könnte ich sicherlich für einige Monate Zahlen nachreichen, wieviele retrodigitalisierte Seiten aufgerufen und ausgeliefert wurden (diese Zahlen liegen leider NICHT für das ganze Jahr vor).

Verfügbarkeit 2002 98% 90% (Dezember offline)

:-( Zum Hintergrund, siehe auch <http://gdz.sub.uni-goettingen.de/server_offline2002.shtml>

URL projekt.gutenberg.de gdz.sub.uni-goettingen.de

* "Parts of our collections are protected by copyright."  Ein
Lizenztext muss akzeptiert werden bei Herunterladen von PDF Dateien.

** Werke und Faksimileseiten haben keine kurze, "bookmarkable" URLs,
nur diese kilometerlange
http://134.76.163.65/servlet/digbib?template=view.html&id=4189&startpage=1&endpage=9&pagenumber=3&image-path=http%3A%2F%2F134.76.176.141%3A80%2Fcgi-bin%2Fletgifsfly.cgi%3Fimageset%3D%2F638&image-subpath=638&imageset-id=638&zoom-factor=100&hlinfo=-1

*** Kein schöner URL, aber es geht, z.B. Volltextsuche "Hamburg":
http://134.76.163.65/servlet/digbib?template=hitlist.html&search-view=simple_search_view&search-attribute1=Volltextsuche&search-value1=hamburg

**** Die Scanner Originale TIFF Dateien und OCR Texte sind von aussen
nicht verfügbar, nur GIF Derivate und druckbare Faksimilebilder in
PDF.

Als weiteres Merkmal wäre ggfs. die Erschliessungstiefe (in wie weit werden Strukturen des Werkes erfasst und für den Benutzer bspw. in Form eines elektronischen Inhaltsverzeichnisses bereitgestellt) aufzunehmen. Die Zeile "Google indexiert" würde ich allgemeiner fassen und als "Unterstützte Nachweissysteme/Suchmaschinen" betiteln. Hier könnten dann bspw. auch Fachkataloge/Datenbanken sowie OPACs und Verbundkataloge aufgeführt werden.

Ciao
Markus Enders, GDZ




Listeninformationen unter http://www.inetbib.de.