[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] wikified OCR, copyfraud (was: Weimarer Monographien Digital - kritisch geprueft)



Hans-Werner Hilse schrieb:
On Wed, 24 May 2006 02:52:40 +0200 "Klaus Graf"
<klaus.graf@xxxxxxxxxxxxxxxxxxxxxxxxxx> wrote:

Fortschritte gemacht hat. Ein "schmutziger" OCR-Text
koennte in einem Wiki analog zu Wikisource gemeinsam
verbessert werden.

http://de.wikisource.org/wiki/Hauptseite

...interessanter Gedanke. Gibt es hierzu bereits Beispiele, wie 
eine konkrete Zusammenarbeit mit Digitalisierern aussehen kann 
bzw. wie so ein Workflow ausgestaltet werden kann?

und: ist es realistisch, mit der kritischen Masse an 
bearbeitungsbereiten Lesern auch auf den eigenen Plattformen der 
Digitalisierer zu rechnen?

Es ist eigentlich viel einfacher.  Der Digitalisierer muss nur die 
hoch aufgelöste Originalbilder freigeben und dies bekanntmachen. 

Dies allein produziert kein Resultat, aber kostet heute auch gar 
nichts.  Ob dann der Digitalisierer selbst oder jemand anderen 
oder gar niemand OCR und Korrekturlesen leistet, ist egal.  Das 
wichtige ist dass alle die Chance haben dies zu tun.  Wenn Klaus 
Graf sich eine Textversion wünscht, kann man ihm also auffordern 
es selbst zu schaffen.  Das einzige sichere Ding ist, dass wenn 
der Digitalisierer die Originalbilder *nicht* freigibt und kein 
Textversion selbst herstellt, dann schenkt man kostenlos Klaus 
Graf die Chance seine Kritik *rechtmässig* daran zu richten.

Ziel ist nicht die perfekte Textversion herzustellen, sondern die 
beste mögliche Arbeit zu machen.  Die, für welche man Dank und 
nicht nur offenbare Kritik bekommen kann.

Ich scannte selbst ein Indexband ("Schlüssel") zu Meyers 
Konversationslexikon (1880), und die Leute in Ulm haben es OCRt 
und Korrektur gelesen,
http://susi.e-technik.uni-ulm.de:8080/Meyers2/stoebern/werk/meyers/band/17/band17.html

Project Gutenberg's Distributed Proofreaders (www.pgdp.net) nehmen 
eingescannte Bücher von mehreren Quellen (auch loc.gov und 
gallica.bnf.fr), und OCRen und Korrekturlesen diese als Workflow.

Auch Wikisource wird dafür gebraucht.

Auch wenn der Digitalisierer selbst die Korrekturlesung 
organisieren und/oder durchführen will, kann er Wikisource oder 
PGDP als Werkzeug/Plattform brauchen.

Wir warten noch auf die hoch aufgelöste Originalbilder von der 
"Allgemeine Deutsche Biographie".  Hallo, BSB München?


-- 
  Lars Aronsson (lars@xxxxxxxxxxx)
  Aronsson Datateknik - http://aronsson.se

  Projekt Runeberg - freie nordische Literatur - http://runeberg.org/



Listeninformationen unter http://www.inetbib.de.