[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Projekt zur Weiterentwicklung von OCR-Verfahren gestartet




 Lieber Herr Stephan,

Das Koordinierungsprojekt beschäftigt sich mit der OCR-Bearbeitung  von Drucken 
des deutschsprachigen Raums aus dem 16. -19. Jahrhundert.  Das Thema 
Frakturschrift ist also sehr präsent und wichtig für uns.
Im Vorhaben soll die Performanz von OCR-Verfahren auf historischen Vorlagen 
zunächst systematisch untersucht  werden. Die Ergebnisse dieser Untersuchungen 
sollen gemeinsam mit den  Ergebnissen von Expertengesprächen in der 
Identifikation und  Formulierung von Bedarfen hinsichtlich der Reduktion von 
Text- und Strukturerkennungsfehlern münden.

Der Fokus des Projekts liegt wie gesagt zunächst auf der  Identifikation 
systematischer Probleme, Lücken und Bedarfe im Bereich  OCR für historische 
Texte. Perspektive des Projektes ist es aber  gemeinsam mit 
Forschungseinrichtungen und Bibliotheken Lösungen für die  aufgeworfenen Fragen 
zu entwickeln. Diese Lösungen können sowohl auf  vorhandenen Ansätzen, 
Algorithmen und Programmen aufsetzen oder auch Neuimplementierungen 
einschließen. Wo möglich machen wir uns dabei für allgemein nachnutzbare 
Ansätze (SW Open Source) stark.

Mit besten Grüßen,
Elisa Herrmann 

Projektkoordination OCR-D
Herzog August Bibliothek Wolfenbüttel 
Lessingplatz 1 
38304 Wolfenbüttel 
Tel. +49 5331/808-306 
Email herrmann@xxxxxx





 Von:   Armin Stephan <armin.stephan@xxxxxxxxxxxx> 
 An:   Elisa Herrmann <herrmann@xxxxxx> 
 Gesendet:   02.11.2015 9:11 
 Betreff:   Re: [InetBib] Projekt zur Weiterentwicklung von OCR-Verfahren 
gestartet 


      
Liebe Frau Herrmann,
         
         mich würde noch interessieren, wie mit dem Thema               
Frakturschriften umgegangen werden soll. Es wundert mich ein                 
wenig, dass dazu in der Projektbeschreibung nichts                 angemerkt 
ist.                   Während                     OCR-Erkennung im Prinzip ja 
problemlos zur Verfügung                       steht für moderne Schriften, 
bieten                     nicht einmal die spezialisierten                     
Buchscanner-Anbieter OCR-Lösungen für                     Frakturschriften an.
                   
                   Greift das                       Projekt vorhandene Lösungen 
auf (wenn ja welche)                       oder sollen Lösungen entwickelt 
werden?
                 
         
         Am 02.11.2015 um 08:58 schrieb Elisa Herrmann:
                   Lieber Herr Romeyken,

(1.) Das  Koordinierungsprojekt baut selbstverständlich auf Arbeitsergebnissen  
der IMPACT-Projekte auf. Das Projekt ImpactOCR endete allerdings 2012,  und 
einige Fragen von damals sind noch offen.
Im Einzelnen werden im Koordinationsprojekt folgende Ziele verfolgt:
    a) Beschreibung der Grundlagen und Module von OCR-Verfahren
    b) die Entwicklung von Richtlinien, Vorschlägen und Konzepten für die 
Umsetzung in die Praxis
    c)  die Entwicklung eines Masterplans auf der Basis der vorhandenen  
nationalbibliographischen Verzeichnisse und Empfehlungen zu  Projektclustern 
für die Phase 2
    d) Beratung und Koordination der Projekte zusammen mit dem Beirat und 
Experten.

Darüberhinaus  sind Entwicklungen des IMPACT-Programms heute teilweise 
kommerziell  eingebunden und stehen somit nicht mehr Open Source zur Verfügung.

(2.) Bereits bestehende  Services und Open Source Angebote (z.B. Software, 
Referenzkorpora) werden  nachgenutzt bzw. fließen in die Überlegungen mit ein. 
Dabei werden kommerzielle Anbieter nicht außer Acht gelassen, um gemeinsame 
Lösungen für die Evaluation und Nachnutzung kommerziell erstellter Tools zu 
erarbeiten. Das entsprechende Informationsangebot  aufrecht zu erhalten und zu 
pflegen ist Ziel dieses Vorhabens, hierfür  wurde ein eigenes Arbeitspaket 
(Nachnutzbarkeit) etabliert.
Die  Anforderungern der DFG nach Interoperabilität, Nachnutzbarkeit,  
Verwendung von Open Source sowie offenen Schnittstellen, modularer  Aufbau und 
nicht zuletzt die Berücksichtigung aktueller Normen und  Standards werden 
erfüllt. Alle durch das Vorhaben zustande  gekommenen Ergebnisse werden der 
Fachöffentlichkeit bekannt gemacht und  stehen zur kostenfreien Nachnutzung 
durch Dritte bereit; dies schließt  die umfassende Dokumentation der Ergebnisse 
mit ein.

(3.) Die Deutsche Forschungsgemeinschaft hat die Projektförderung über einen  
Zeitraum von drei Jahren bewilligt. Die derzeitige Projektphase 1 endet nach 12 
 Monaten.

Ich hoffe ich konnte Ihre Fragen damit beantworten.

Mit besten Grüßen,
Elisa Herrmann 

Projektkoordination OCR-D
Herzog August Bibliothek Wolfenbüttel 
Lessingplatz 1 
38304 Wolfenbüttel 
Tel. +49 5331/808-306 
Email herrmann@xxxxxx





 Von:   "Romeyke, Andreas" <Andreas.Romeyke@xxxxxxxxxxxxxxx> 
 An:   "inetbib@xxxxxxxxxx" <inetbib@xxxxxxxxxx> 
 Gesendet:   30.10.2015 9:33 
 Betreff:   Re: [InetBib] Projekt zur Weiterentwicklung von OCR-Verfahren 
gestartet 

Hallo, 
 
Könnten Sie bitte ff. Fragen beantworten: 
 
1. Inwiefern unterscheidet sich das Projekt von den Zielstellungen von 
ImpactOCR (http://www.impact-project.eu) 
2. Inwieweit werden die Ziele des Projektes mit OpenSource-Software umgesetzt, 
bzw. OpenSource-Community eingebunden, bzw. Nachnutzung sichergestellt 
3. Wie sieht der Zeitrahmen aus?  
 
Mit freundlichen Grüßen 
With best regards, 
 
Andreas Romeyke 
          
          
--         
         
         Mit freundlichen Gruessen
              Armin Stephan
              Jefe de Biblioteca
         Augustana-Hochschule / Bibliothek
         Waldstr. 15
              D-91564           Neuendettelsau
         Tel. 09874/509-300
         |
         |      ,__o
         |    _-\_<,
         |   (*)/'(*) 
                 

 


Listeninformationen unter http://www.inetbib.de.