Liebe Liste,
ich habe den Eindruck, dass seit einigen Jahren bei der Digitalisierung von (auch
älteren) Druckwerken ein OCR-Programm mitläuft und automatisch eine
mehr/weniger brauchbare Transkription des Faksimiles liefert. Vor einiger Zeit bekam ich
von einer wissenschaftlichen Bibliothek die Auskunft, dies sei ein Teil der Leistung, die
Google bei Digitalisierungskampagnen erbringe, sie seien aber selbst nicht eingebunden.
Weiß jemand, ob dies heute auch noch der Fall ist und welche OCR-Programme andernfalls von den Bibliotheken eingesetzt werden? Da
ich mich in meinem Webportal (s. die URL's unten) seit Jahren mit der Volltextdigitalisierung (rechts-)historischer Quellen
beschäftige, wüßte ich gerne mehr über die Hintergründe. Denn bei allem Nutzen, den diese ocr-erzeugten Texte
hierfür haben: Die Nachbearbeitung ist immer noch äußerst zeitaufwendig und vielleicht gäbe es da ja
Verbesserungsmöglichkeiten.
Mit bestem Dank für jede Auskunft, gerne auch außerhalb der Liste.
Heino Speer
-- Dr. Heino Speer
Paschingergasse 17
9020 Klagenfurt / Österreich
----------------------------
Daimlerweg 3
69226 Nußloch / Deutschland
----------------------------
http://repertorium.at
http://repositorium-rechtsgeschichte-fnz.de
http://drqerg.de/buchkunst_digitalisiert
-- Diese E-Mail wurde von AVG auf Viren geprüft.
http://www.avg.com