[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Deutsche digitale Bibliotheken
Hallo Herr Aronsson,
Lars Aronsson wrote:
Wieviel deutschsprachige Literatur (Bücher und Zeitschriften) ist
bisher retrospektiv digitalisiert geworden, wo kann man es finden, und
welche Anzahl von Benutzern haben diese Sammlungen? Gibt es irgendwo
eine Übersicht, Zusammenfassung, Auswertung?
Meines Wissens gibt es keine Übersichten oder Statistiken, die sämtliche
Projekte mit den von Ihnen genannten Daten liefern.
Das GDZ hält eine Liste der DFG-geförderten Digitalisierungsprojekte
bereit, sofern sie uns denn gemeldet werden. Diese Liste wird auch noch
weiterhin gepflegt.
<http://gdz.sub.uni-goettingen.de/en/vdf-e/vdf-liste-e.shtml>
Auf der Homepage des GDZ <http://gdz.sub.uni-goettingen.de> den
Menupunkt "DFG-Projects" auswählen.
So etwa könnte vielleicht ein Vergleich aussehen, aber mit mehr
Projekte:
Ich darf einige Angaben zum GDZ korrigieren bzw. ergänzen, ja?
Projekt Gutenberg-DE GDZ
Gegründet 1994 1996?
1997 - siehe auch
<http://gdz.sub.uni-goettingen.de/en/main/background-e.shtml>
Förderung Kein? DFG, SUB Göttingen
Preis Kostenlos Kostenlos
Lizenz Urheberrechtsfrei ? *
Auf dem Server des GDZ befinden sich digitale Dokumente mehrere
Projekte. In einigen dieser Projekte wurde unter anderem auch
urheberrechtsgeschütztes Material gescannt und online gestellt - dies
betrifft überwiegend die Kollektion "Mathematica".
Faksimile Nein Ja
Druckbar Ja (HTML) Ja (PDF)
Google indexiert Ja Nein
OCR Volltext suchbar Nein Ja (unvollständig?)
Es existiert nur ein so kleiner Teil in Volltext, dass dieser eigentlich nur zu Demonstrationszwecke dient. Ich würde daher obige Spalte nicht unbedingt mit "ja" beantworten.
Zur Zeit wird versucht, einige Dokumente aus einigen Kollektionen auch im Volltext anzubieten. Aus Kostengründen wird vermutlich niemals der komplette Bestand des Dokumentenservers im Volltext angeboten werden können.
Ebenso aus Kostengründen ist bislang eine Erfassung des Volltextes gescheitert.
Tief linkbar Ja Nein **
Wir arbeiten dran :-)
Suche linkbar Nein Ja ***
Open source Ja Nein ****
Kurze Anmerkung: Die PDFs enthalten die Images in voller Auflösung (bspw. bitonal 600dpi).
Das macht unserer Ansicht nach mehr Sinn, als die einzelnen Images als TIFF in derselben Auflösung auszuliefern.
Ein Informationsverlust bei der Konvertierung in PDF tritt also nicht auf.
Bei den 600dpi TIFFs, die den PDFs zugrunde liegen,handelt es sich jedoch NICHT um die originalen Scanner-Dateien, sondern um nachträglich optimierte Images. Gerade bei älteren Werken ist dies erforderlich und erhöht die Lesbarkeit ganz erheblich.
Genre Belletristik Naturwissenschaften
Der Dokumentenserver des GDZ enthält Dokumente verschiedenster Digitalisierungsprojekte, die verschiedene fachliche Schwerpunkte haben/hatten.
Der Bereich Mathematica ist für sich genommen sicherlich der grösste Bereich, macht aber zur Zeit gerade mal die Hälfte aller Dokumente aus.
Weitere Kollektionen mit hoher Anzahl an Dokumenten sind bspw. die Reisebeschreibungen (Itineraria) und die Wissenschaftsgeschichte (History of the Humanities and Sciences).
Naturwissenschaften beschreibt also den Inhalt des Dokumentenservers nur zur Hälfte.
Anzahl Bände/Werke 400 3386
Anzahl Textseiten ? 1,3 Mio
Anzahl Benutzer ? ?
Die Benutzerzahl können wir nicht nachliefern, da wir weder ein Tracking durchführen noch eine Benutzeranmeldung durchführen.
Bei Interesse könnte ich sicherlich für einige Monate Zahlen nachreichen, wieviele retrodigitalisierte Seiten aufgerufen und ausgeliefert wurden (diese Zahlen liegen leider NICHT für das ganze Jahr vor).
Verfügbarkeit 2002 98% 90% (Dezember offline)
:-(
Zum Hintergrund, siehe auch <http://gdz.sub.uni-goettingen.de/server_offline2002.shtml>
URL projekt.gutenberg.de gdz.sub.uni-goettingen.de
* "Parts of our collections are protected by copyright." Ein
Lizenztext muss akzeptiert werden bei Herunterladen von PDF Dateien.
** Werke und Faksimileseiten haben keine kurze, "bookmarkable" URLs,
nur diese kilometerlange
http://134.76.163.65/servlet/digbib?template=view.html&id=4189&startpage=1&endpage=9&pagenumber=3&image-path=http%3A%2F%2F134.76.176.141%3A80%2Fcgi-bin%2Fletgifsfly.cgi%3Fimageset%3D%2F638&image-subpath=638&imageset-id=638&zoom-factor=100&hlinfo=-1
*** Kein schöner URL, aber es geht, z.B. Volltextsuche "Hamburg":
http://134.76.163.65/servlet/digbib?template=hitlist.html&search-view=simple_search_view&search-attribute1=Volltextsuche&search-value1=hamburg
**** Die Scanner Originale TIFF Dateien und OCR Texte sind von aussen
nicht verfügbar, nur GIF Derivate und druckbare Faksimilebilder in
PDF.
Als weiteres Merkmal wäre ggfs. die Erschliessungstiefe (in wie weit werden Strukturen des Werkes erfasst und für den Benutzer bspw. in Form eines elektronischen Inhaltsverzeichnisses bereitgestellt) aufzunehmen.
Die Zeile "Google indexiert" würde ich allgemeiner fassen und als "Unterstützte Nachweissysteme/Suchmaschinen" betiteln. Hier könnten dann bspw. auch Fachkataloge/Datenbanken sowie OPACs und Verbundkataloge aufgeführt werden.
Ciao
Markus Enders, GDZ
Listeninformationen unter http://www.inetbib.de.