[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] wikified OCR, copyfraud (was: Weimarer Monographien Digital - kritisch geprueft)
- Date: Thu, 25 May 2006 04:01:28 +0200 (CEST)
- From: Lars Aronsson <lars@xxxxxxxxxxx>
- Subject: Re: [InetBib] wikified OCR, copyfraud (was: Weimarer Monographien Digital - kritisch geprueft)
Hans-Werner Hilse schrieb:
On Wed, 24 May 2006 02:52:40 +0200 "Klaus Graf"
<klaus.graf@xxxxxxxxxxxxxxxxxxxxxxxxxx> wrote:
Fortschritte gemacht hat. Ein "schmutziger" OCR-Text
koennte in einem Wiki analog zu Wikisource gemeinsam
verbessert werden.
http://de.wikisource.org/wiki/Hauptseite
...interessanter Gedanke. Gibt es hierzu bereits Beispiele, wie
eine konkrete Zusammenarbeit mit Digitalisierern aussehen kann
bzw. wie so ein Workflow ausgestaltet werden kann?
und: ist es realistisch, mit der kritischen Masse an
bearbeitungsbereiten Lesern auch auf den eigenen Plattformen der
Digitalisierer zu rechnen?
Es ist eigentlich viel einfacher. Der Digitalisierer muss nur die
hoch aufgelöste Originalbilder freigeben und dies bekanntmachen.
Dies allein produziert kein Resultat, aber kostet heute auch gar
nichts. Ob dann der Digitalisierer selbst oder jemand anderen
oder gar niemand OCR und Korrekturlesen leistet, ist egal. Das
wichtige ist dass alle die Chance haben dies zu tun. Wenn Klaus
Graf sich eine Textversion wünscht, kann man ihm also auffordern
es selbst zu schaffen. Das einzige sichere Ding ist, dass wenn
der Digitalisierer die Originalbilder *nicht* freigibt und kein
Textversion selbst herstellt, dann schenkt man kostenlos Klaus
Graf die Chance seine Kritik *rechtmässig* daran zu richten.
Ziel ist nicht die perfekte Textversion herzustellen, sondern die
beste mögliche Arbeit zu machen. Die, für welche man Dank und
nicht nur offenbare Kritik bekommen kann.
Ich scannte selbst ein Indexband ("Schlüssel") zu Meyers
Konversationslexikon (1880), und die Leute in Ulm haben es OCRt
und Korrektur gelesen,
http://susi.e-technik.uni-ulm.de:8080/Meyers2/stoebern/werk/meyers/band/17/band17.html
Project Gutenberg's Distributed Proofreaders (www.pgdp.net) nehmen
eingescannte Bücher von mehreren Quellen (auch loc.gov und
gallica.bnf.fr), und OCRen und Korrekturlesen diese als Workflow.
Auch Wikisource wird dafür gebraucht.
Auch wenn der Digitalisierer selbst die Korrekturlesung
organisieren und/oder durchführen will, kann er Wikisource oder
PGDP als Werkzeug/Plattform brauchen.
Wir warten noch auf die hoch aufgelöste Originalbilder von der
"Allgemeine Deutsche Biographie". Hallo, BSB München?
--
Lars Aronsson (lars@xxxxxxxxxxx)
Aronsson Datateknik - http://aronsson.se
Projekt Runeberg - freie nordische Literatur - http://runeberg.org/
Listeninformationen unter http://www.inetbib.de.