[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] Alte Drucke und OCR



Liebe Liste,
ich habe den Eindruck, dass seit einigen Jahren bei der Digitalisierung von (auch älteren) Druckwerken ein OCR-Programm mitläuft und automatisch eine mehr/weniger brauchbare Transkription des Faksimiles liefert. Vor einiger Zeit bekam ich von einer wissenschaftlichen Bibliothek die Auskunft, dies sei ein Teil der Leistung, die Google bei Digitalisierungskampagnen erbringe, sie seien aber selbst nicht eingebunden. Weiß jemand, ob dies heute auch noch der Fall ist und welche OCR-Programme andernfalls von den Bibliotheken eingesetzt werden? Da ich mich in meinem Webportal (s. die URL's unten) seit Jahren mit der Volltextdigitalisierung (rechts-)historischer Quellen beschäftige, wüßte ich gerne mehr über die Hintergründe. Denn bei allem Nutzen, den diese ocr-erzeugten Texte hierfür haben: Die Nachbearbeitung ist immer noch äußerst zeitaufwendig und vielleicht gäbe es da ja Verbesserungsmöglichkeiten.
Mit bestem Dank für jede Auskunft, gerne auch außerhalb der Liste.
Heino Speer

--
Dr. Heino Speer
Paschingergasse 17
9020 Klagenfurt / Österreich
----------------------------
Daimlerweg 3
69226 Nußloch / Deutschland
----------------------------
http://repertorium.at
http://repositorium-rechtsgeschichte-fnz.de
http://drqerg.de/buchkunst_digitalisiert



--
Diese E-Mail wurde von AVG auf Viren geprüft.
http://www.avg.com

Listeninformationen unter http://www.inetbib.de.