[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] wikified OCR, copyfraud
- Date: Thu, 25 May 2006 08:38:25 +0200
- From: Karl Eichwalder <ke@xxxxxxxxxxxxxx>
- Subject: Re: [InetBib] wikified OCR, copyfraud
Hans-Werner Hilse <hilse@xxxxxx> writes:
...interessanter Gedanke. Gibt es hierzu bereits Beispiele, wie eine
konkrete Zusammenarbeit mit Digitalisierern aussehen kann bzw. wie so
ein Workflow ausgestaltet werden kann?
Auf die prominenten freien Projekte hat Lars Aronsson bereits
hingewiesen: wikisource.org und vor allen Dingen die "Distributed
Proofreaders" des internationalen Project Gutenberg
(http://www.pgdp.net/) mit der europäischen Filiale
(http://dp.rastko.net/default.php), wo insbesondere die Bücher
bearbeitet werden können, die nach den US-Regeln noch nicht frei sind
(Tod plus 50/70 Jahre).
und: ist es realistisch, mit der kritischen Masse an
bearbeitungsbereiten Lesern auch auf den eigenen Plattformen der
Digitalisierer zu rechnen?
Sehr realistisch, zumal es bei freien Projekten keine Zeitvorgaben
gibt. Hier zwei Beispiele, in beiden Fällen handelt es sich um Ausgaben
des "Litterarischen Vereins in Stuttgart" (um 1860), die zumindest
wissenschaftsgeschichtlich interessant und auch durchaus noch maßgeblich
sind:
. http://de.wikisource.org : Die "Martina", eine umfangreiche
Versdichtung des mittelhochdeutschen Dichters Hugo von Langenstein, habe
ich um den 1. April 2006 gestartet; von den über 700 Seiten liegen
mittlerweile 10% in erstaunlich guter Qualität vor:
http://de.wikisource.org/wiki/Martina - Image-Provider war zunächst
Google, fehlerhafte Seiten habe ich nachgescant.
. http://www.pgdp.net/ : Endres Tuchers "Baumeisterbuch der Stadt
Nürnberg" (Ende 15. Jh.) habe ich Anfang Mai 2006 bei den Distributed
Proofreaders zur Bearbeitung freigegeben. Von den gut 400 Seiten sind
bereits über 70 textlich erfaßt:
http://www.pgdp.net/c/project.php?id=projectID442650f669d9e - auch hier
sind die bescheidenen Google-Scans die Grundlage, die von einem anderen
Mitarbeiter komplettiert wurde.
Wenn solch relativ komplizierte Texte angenommen werden, sollte man sich
bei Prosatexten des 18./19. Jh. erst recht keine Sorgen machen.
Ich halte es jedenfalls für recht unwahrscheinlich, dass viele die
nötige Einarbeitungszeit aufbringen werden, sich an verschieden
ausgestaltete Edit-Portale zu gewöhnen.
Ich denke, daß sich die interessierten Mitarbeiter für 1 oder zwei
Projekte entscheiden werden. Auch da sind Bedenken unbegründet.
Unverständlich ist jedoch, daß sich insbesondere die deutschen
Institutionen weigern, eine Weiterverwendung der Scans zuzulassen--oder
wie ist dieses Weimaraner © zu verstehen?
--
http://www.gnu.franken.de/ke/ | ,__o
| _-\_<,
| (*)/'(*)
Key fingerprint = F138 B28F B7ED E0AC 1AB4 AA7F C90A 35C3 E9D0 5D1C
Listeninformationen unter http://www.inetbib.de.