[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: DigiZeitschriften-Kommerz
Eine kurze Notiz zu den Digitalisierungskosten (I.), basierend auf
meinen frueheren Erfahrungen im Goettinger Digitalisierungszentrum:
Ausgehend von 30 Seiten, durchschnittlicher Schwierigkeitgrad (d.h. z.B.
keine besonderen Probleme beim Oeffnen des Buches, maessiger bis guter
Kontrast):
1. Scannen mit dem Buchscanner incl. QK: ca. 15-20 Minuten
2. Etwaige Bildnachbearbeitung (bei diesem Material im Batchprozess,
z.B. Reinigen, Geraderuecken, zentrieren): max. 5-10 Minuten
Maschinenlaufzeit
3. Erstellen unkorrigierter OCR-Text (im Batchprozess): ca. 10 Minuten
Maschinenlaufzeit + ggf. ca. 15 Minuten QK (keine systematische
Textkorrektur)
Die tatsaechlichen Zeiten alleine fuer diese Arbeitschritte betragen
somit ca. 30 Minuten plus etwas 20 Minuten Maschinenlaufzeit, die aber
natuerlich auch ueber Nacht ablaufen kann. Dies sind realistische
Zahlen aus der Produktion und stehen den zitierten 2 Stunden gegenueber.
Mit freundlichem Gruss
Norbert Lossau
On Tue, 26 Feb 2002 20:50:04 +0100 Klaus Graf <graf _at__ uni-koblenz.de>
wrote:
> kaemper _at__ ub.uni-stuttgart.de wrote:
> >
> > Herr Graf,
>
> Sehr geehrter Herr Kaemper,
> kann es sein, dass Ihnen im Eifer des Gefechts die Hoeflichkeit abhanden
> gekommen ist? Ich habe Sie nicht persoenlich beleidigt, ich habe
> lediglich deutlich zum Ausdruck gebracht, was ich von Ihrem Beitrag
> halte. Ist das verboten und ein Verstoss gegen die Netiquette? Duerfen
> hier Meinungen nicht mehr frei geauessert werden, weil dann Beteiligte
> patzig und ruede werden? Mit "Herr Graf" eine Mail zu eroeffnen, hat
> nur derjenige noetig, dessen sachliche Argumente allzu schwach sind.
>
>
> > sicher werden Sie auch diesen Einwurf wieder überflüssig finden: es sei
> > Ihnen unbenommen.
>
> Das ist aber grosszuegig!
>
> Doch zurueck zur Sache:
>
> Ueber das, was angemessen bzw. extrem hoch ist, wird man sicher lange
> streiten koennen.
>
> I. Notiz zu den Digitalisierungskosten aus DIGITAL-COPYRIGHT
>
> Laurie Urquiaga schrieb dort:
>
> here are several services out there that digitize hard copy documents.
> The vendor BYU has used in the past has been Data Conversion
> Laboratories, and costs averaged $.50 to $85/page, depending on the
> processing requirements (this gives html or text output). Other vendors
> mentioned have been Pacific Data and InnoData. Another vendor that we
> appear to be looking at very closely now, although we haven't had them
> do any work yet, is iArchives (http://www.iarchives.com/). Early
> indications seem to be that they will digitize/capture documents and
> provide a text-overlay pdf file for about $.20/page, which would be
> phenomenal.
>
> Searchable PDFs are often backed by 'dirty text', which means that you
> just take the ocr output 'as is' and link it behind the image. If you
> have a 98% accurate ocr file, the result is that approximately 2% of the
> document isn't searchable because the ocr program didn't recognize it
> correctly. However, the likelihood is that most of the time, the user
> will find what they need, and not editing probably saves 90-95% of the
> effort required to create a clean text result. That the text is dirty
> isn't apparent to the reader, because they're looking at the facsimile
> images and not the text file itself. The risk in using this format is
> that a highly specific or technical term might be part of the text that
> is not recognized and thus the searcher will get a 'no-hits' result even
> though the document actually contains that term.
>
> The difference in outputs explains the difference in average per page
> costs. However, my experience is that it usually takes about 2 hours to
> scan, clean up (erase black areas, spots, etc.) and capture a 30 page
> legal brief (resulting in a dirty text linked to/hidden behind a clean
> image). That means we're expending about $.50/page in student wages
> alone for the initial labor. It costs more for documents that are more
> complicated than the average legal brief (ie. containing pictures,
> tables, columns, whatever). Add in quality control and metadata
> indexing and the cost more than doubles. For things we don't have time
> to send out to a vendor, it is worth it to do this ourselves. But where
> time is less important, it makes more sense to outsource the labor,
> which was the point of my earlier post.
>
> II. Argumente gegen ein kostenpflichtiges System
>
> Katja Mruck schrieb:
>
> "Als Herausgeberin einer mehrsprachigen und kostenfrei zugaenglichen
> Online-Zeitschrift weiss ich von dem Feedback, das wir von
> Kollegen und Kolleginnen aus aller Welt erhalten, wie wichtig es fuer
> sie ist, nicht wegen fehlender Gelder von den Diskursen der
> internationalen wissenschaftlichen Gemeinschaft ausgeschlossen zu sein."
>
> Die BOAI kann zu einer staerkeren Vernetzung der Wissenschaft beitragen.
> Warum gibt es denn so wenige JSTOR oder MUSE-Nutzer in Deutschland? Und
> warum werden sich vermutlich nicht auf breiter Front Bibliotheken
> ausserhalb des deutschsprachigen Bereichs DigiZeitschriften zulegen? Bei
> den Preisen denkt man nach wie vor national und leistet sich
> vorzugsweise Publikationen der eigenen Sprache.
>
> Kostenpflichtige Angebote werden vermutlich zur Verschlechterung der
> Arbeitsbedingungen von unabhaengigen Wissenschaftlern fuehren, weil die
> "normale" konventionelle Fernleihe einem pay-per-view-Entgelt immer
> naeher kommen wird.
>
> Kostenpflichtige Angebote grenzen auslaendische Wissenschaftler aus,
> deren Institutionen aus welchen Gruenden auch immer (finanzielle oder
> andere) einen Bezug nicht fuer sinnvoll halten.
>
> Kostenpflichtige Angebote grenzen Wissenschaftler aus, die
> institutionell nicht angebunden sind oder deren Institutionen aus
> finanziellen Ruecksichten oder einer genereller Scheu vor
> Onlinepublikationen ("Papier ist dauerhafter" und wieso dann zweimal
> zahlen?) nicht abonnieren wollen.
>
> Kostenlose Angebote, die jeder Wissenschaftler von seinem Arbeitsplatz
> aus aufrufen kann, machen ihn unabhaengig von der nicht leicht zu
> ertragenden Willkuer von Bibliotheksdirektoren und -Referenten, die
> Anschaffungsvorschlaege ohne Begruendung einfach abweisen koennen.
>
> Ich habe hier letztes Jahr mal aus Anlass der DOCSTER-Diskussion
> angeregt, per Mail erledigte Fernleihen nicht mehr geschuetzter
> Literatur auf Bibliotheksservern vorzuhalten und somit nur einmal zu
> scannen - Herr Eversberg wollte sich darum kuemmern, aber es hat sich
> inzwischen nicht das geringste getan. Das haengt wohl auch damit
> zusammen, dass die naturwissenschaftliche Orientierung von derlei
> Debatten nur aktuelle (geschuetzte) Zeitschrifteninhalte im Blick hat.
>
> Kann man Alternativarchive zu DigiZeitschriften aufbauen? Auf die
> BOAI-Unterzeichner zu setzen, scheint verfehlt: Warum sollten die von
> Katja Mruck aufgefuehrten Unterzeichner von BOAI denn ausgerechnet
> Kernzeitschriften der deutschen Forschung digitalisieren? Frau Mruck hat
> es nicht fuer noetig erachtet, auf meine Nachfrage, wie ihre Bemerkung,
> man habe ja "Wahlen", zu verstehen sei, zu reagieren.
>
> Eine Nutzung der DigiZeitschriften-Daten, soweit diese nicht mehr
> geschuetzte Literatur betreffen, setzt voraus, dass man sich
> juristisch/urheberrechtlich warm anzieht, da ein kollektiv
> zusammengetragenes Archiv geeignet ist, die berechtigten Interessen des
> Datenbankherstellers zu beeintraechtigen (s. Vogel in Schricker, UrhR ²
> § 87b Rndr. 23, S. 1349). Obwohl die gemeinfreien Artikel an sich nicht
> geschuetzt sind, erfuellt DigiZeitschriften das Kriterium der
> wesentlichen Investition. Auswege waeren: auslaendischer Server ohne
> deutsche Verantwortliche, Entfernung identifizierbarer Kennzeichen aus
> Text- und Bilddateien (digitale Wasserzeichen).
>
> Wenn man diesen Weg nicht gehen moechte, bleibt nur: nochmals scannen.
>
> Aber was waere denn illegal daran, der Public Domain endlich das zu
> geben, was ihr schon von Gesetzes wegen gehoert? Ich halte es mit zwei
> Juristen (Artur Wandtke/Winfried Bullinger), die 1997 in GRUR 1997 S.
> 577 schrieben:
>
> "Die zeitliche Begrenzung des Urheberrechts [§ 64 UrhG] hat nicht nur
> bloß eine negative Ausschlußfunktion. Sie hat vor allem auch die
> positive Zuordnungsfunktion, urheberrechtliche Werke dem Gemeingebrauch
> zur Verfügung zu stellen".
>
> Klaus Graf
============================================
Dr. Norbert Lossau
Head of the Oxford Digital Library (ODL)/
Oxford University Library Services (OULS)
99 Banbury Road
Oxford, OX2 6JX
nl _at__ ulib.ox.ac.uk
Phone:+44 1865 284457
Fax:+44 1865 284456
=============================================
Listeninformationen unter http://www.inetbib.de.