[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[InetBib] Alte Drucke und OCR
- Date: Sun, 17 May 2020 07:28:19 +0200
- From: Heino Speer via InetBib <inetbib@xxxxxxxxxx>
- Subject: [InetBib] Alte Drucke und OCR
Liebe Liste,
ich habe den Eindruck, dass seit einigen Jahren bei der Digitalisierung
von (auch älteren) Druckwerken ein OCR-Programm mitläuft und automatisch
eine mehr/weniger brauchbare Transkription des Faksimiles liefert. Vor
einiger Zeit bekam ich von einer wissenschaftlichen Bibliothek die
Auskunft, dies sei ein Teil der Leistung, die Google bei
Digitalisierungskampagnen erbringe, sie seien aber selbst nicht eingebunden.
Weiß jemand, ob dies heute auch noch der Fall ist und welche
OCR-Programme andernfalls von den Bibliotheken eingesetzt werden? Da ich
mich in meinem Webportal (s. die URL's unten) seit Jahren mit der
Volltextdigitalisierung (rechts-)historischer Quellen beschäftige, wüßte
ich gerne mehr über die Hintergründe. Denn bei allem Nutzen, den diese
ocr-erzeugten Texte hierfür haben: Die Nachbearbeitung ist immer noch
äußerst zeitaufwendig und vielleicht gäbe es da ja
Verbesserungsmöglichkeiten.
Mit bestem Dank für jede Auskunft, gerne auch außerhalb der Liste.
Heino Speer
--
Dr. Heino Speer
Paschingergasse 17
9020 Klagenfurt / Österreich
----------------------------
Daimlerweg 3
69226 Nußloch / Deutschland
----------------------------
http://repertorium.at
http://repositorium-rechtsgeschichte-fnz.de
http://drqerg.de/buchkunst_digitalisiert
--
Diese E-Mail wurde von AVG auf Viren geprüft.
http://www.avg.com
Listeninformationen unter http://www.inetbib.de.