[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Projekt zur Weiterentwicklung von OCR-Verfahren gestartet
- Date: Mon, 2 Nov 2015 13:51:18 +0100
- From: Elisa Herrmann <herrmann@xxxxxx>
- Subject: Re: [InetBib] Projekt zur Weiterentwicklung von OCR-Verfahren gestartet
Lieber Herr Stephan,
Das Koordinierungsprojekt beschäftigt sich mit der OCR-Bearbeitung von Drucken
des deutschsprachigen Raums aus dem 16. -19. Jahrhundert. Das Thema
Frakturschrift ist also sehr präsent und wichtig für uns.
Im Vorhaben soll die Performanz von OCR-Verfahren auf historischen Vorlagen
zunächst systematisch untersucht werden. Die Ergebnisse dieser Untersuchungen
sollen gemeinsam mit den Ergebnissen von Expertengesprächen in der
Identifikation und Formulierung von Bedarfen hinsichtlich der Reduktion von
Text- und Strukturerkennungsfehlern münden.
Der Fokus des Projekts liegt wie gesagt zunächst auf der Identifikation
systematischer Probleme, Lücken und Bedarfe im Bereich OCR für historische
Texte. Perspektive des Projektes ist es aber gemeinsam mit
Forschungseinrichtungen und Bibliotheken Lösungen für die aufgeworfenen Fragen
zu entwickeln. Diese Lösungen können sowohl auf vorhandenen Ansätzen,
Algorithmen und Programmen aufsetzen oder auch Neuimplementierungen
einschließen. Wo möglich machen wir uns dabei für allgemein nachnutzbare
Ansätze (SW Open Source) stark.
Mit besten Grüßen,
Elisa Herrmann
Projektkoordination OCR-D
Herzog August Bibliothek Wolfenbüttel
Lessingplatz 1
38304 Wolfenbüttel
Tel. +49 5331/808-306
Email herrmann@xxxxxx
Von: Armin Stephan <armin.stephan@xxxxxxxxxxxx>
An: Elisa Herrmann <herrmann@xxxxxx>
Gesendet: 02.11.2015 9:11
Betreff: Re: [InetBib] Projekt zur Weiterentwicklung von OCR-Verfahren
gestartet
Liebe Frau Herrmann,
mich würde noch interessieren, wie mit dem Thema
Frakturschriften umgegangen werden soll. Es wundert mich ein
wenig, dass dazu in der Projektbeschreibung nichts angemerkt
ist. Während OCR-Erkennung im Prinzip ja
problemlos zur Verfügung steht für moderne Schriften,
bieten nicht einmal die spezialisierten
Buchscanner-Anbieter OCR-Lösungen für Frakturschriften an.
Greift das Projekt vorhandene Lösungen
auf (wenn ja welche) oder sollen Lösungen entwickelt
werden?
Am 02.11.2015 um 08:58 schrieb Elisa Herrmann:
Lieber Herr Romeyken,
(1.) Das Koordinierungsprojekt baut selbstverständlich auf Arbeitsergebnissen
der IMPACT-Projekte auf. Das Projekt ImpactOCR endete allerdings 2012, und
einige Fragen von damals sind noch offen.
Im Einzelnen werden im Koordinationsprojekt folgende Ziele verfolgt:
a) Beschreibung der Grundlagen und Module von OCR-Verfahren
b) die Entwicklung von Richtlinien, Vorschlägen und Konzepten für die
Umsetzung in die Praxis
c) die Entwicklung eines Masterplans auf der Basis der vorhandenen
nationalbibliographischen Verzeichnisse und Empfehlungen zu Projektclustern
für die Phase 2
d) Beratung und Koordination der Projekte zusammen mit dem Beirat und
Experten.
Darüberhinaus sind Entwicklungen des IMPACT-Programms heute teilweise
kommerziell eingebunden und stehen somit nicht mehr Open Source zur Verfügung.
(2.) Bereits bestehende Services und Open Source Angebote (z.B. Software,
Referenzkorpora) werden nachgenutzt bzw. fließen in die Überlegungen mit ein.
Dabei werden kommerzielle Anbieter nicht außer Acht gelassen, um gemeinsame
Lösungen für die Evaluation und Nachnutzung kommerziell erstellter Tools zu
erarbeiten. Das entsprechende Informationsangebot aufrecht zu erhalten und zu
pflegen ist Ziel dieses Vorhabens, hierfür wurde ein eigenes Arbeitspaket
(Nachnutzbarkeit) etabliert.
Die Anforderungern der DFG nach Interoperabilität, Nachnutzbarkeit,
Verwendung von Open Source sowie offenen Schnittstellen, modularer Aufbau und
nicht zuletzt die Berücksichtigung aktueller Normen und Standards werden
erfüllt. Alle durch das Vorhaben zustande gekommenen Ergebnisse werden der
Fachöffentlichkeit bekannt gemacht und stehen zur kostenfreien Nachnutzung
durch Dritte bereit; dies schließt die umfassende Dokumentation der Ergebnisse
mit ein.
(3.) Die Deutsche Forschungsgemeinschaft hat die Projektförderung über einen
Zeitraum von drei Jahren bewilligt. Die derzeitige Projektphase 1 endet nach 12
Monaten.
Ich hoffe ich konnte Ihre Fragen damit beantworten.
Mit besten Grüßen,
Elisa Herrmann
Projektkoordination OCR-D
Herzog August Bibliothek Wolfenbüttel
Lessingplatz 1
38304 Wolfenbüttel
Tel. +49 5331/808-306
Email herrmann@xxxxxx
Von: "Romeyke, Andreas" <Andreas.Romeyke@xxxxxxxxxxxxxxx>
An: "inetbib@xxxxxxxxxx" <inetbib@xxxxxxxxxx>
Gesendet: 30.10.2015 9:33
Betreff: Re: [InetBib] Projekt zur Weiterentwicklung von OCR-Verfahren
gestartet
Hallo,
Könnten Sie bitte ff. Fragen beantworten:
1. Inwiefern unterscheidet sich das Projekt von den Zielstellungen von
ImpactOCR (http://www.impact-project.eu)
2. Inwieweit werden die Ziele des Projektes mit OpenSource-Software umgesetzt,
bzw. OpenSource-Community eingebunden, bzw. Nachnutzung sichergestellt
3. Wie sieht der Zeitrahmen aus?
Mit freundlichen Grüßen
With best regards,
Andreas Romeyke
--
Mit freundlichen Gruessen
Armin Stephan
Jefe de Biblioteca
Augustana-Hochschule / Bibliothek
Waldstr. 15
D-91564 Neuendettelsau
Tel. 09874/509-300
|
| ,__o
| _-\_<,
| (*)/'(*)
Listeninformationen unter http://www.inetbib.de.