[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[InetBib] Wettbewerb: Texterkennung für hist. Handschriften
- Date: Wed, 30 Nov 2016 17:50:33 +0100
- From: Günter Mühlberger via InetBib <inetbib@xxxxxxxxxx>
- Subject: [InetBib] Wettbewerb: Texterkennung für hist. Handschriften
Liebe Kolleginnen und Kollegen,
im Rahmen des H2020 Projekts READ (Recognition and Enrichment of
Archival Documents) veranstalten wir eine Reihe von wissenschaftlichen
Wettbewerben rund um das Thema "Handschriftenerkennung". Fuer die
"International Conference on Document Analysis and Recognition", 2017 in
Kyoto, bereiten unsere Kollegen der Technischen Universitaet Valencia
gerade ein Proposal vor, bei dem die Teilnehmer erstmals dank der
tatkraeftigen Unterstuetzung der Alfred Escher Stiftung ca. 10.000
transkribierte Seiten zum Training erhalten werden (siehe:
https://www.briefedition.alfred-escher.ch/). Das Datenset besteht aus
mehr als 200 Schreibern und sollte somit schon einigermassen
repraesentativ fuer Handschriften der zweiten Haelfte des 19.
Jahrhunderts sein.
Um aber testen zu koennen, wie gut die jeweiligen Modelle die auf dem
Alfred Escher Set trainiert wurden, fuer Handschriften funktionieren,
die NICHT Teil des Trainingssets waren, wuerden wir ein Testset von ca.
10-20 SChreibern des 19. Jahrhunderts bzw. bevorzugt der zweiten Haelfte
des 19. Jahrhunderts benoetigen. Pro Schreiber waeren ca. 5-10 Seiten
ausreichend, die Seiten koennen auch aus verschiedenen Dokumenten
stammen. Falls Transkriptionen vorhanden sind, ist das sehr gut, falls
nicht, kein Problem, dann werden wir die Transkription im Rahmen des
Projekts durchfuehren.
Fuer alle die sich an dieser Aktion beteiligen moechten ergibt sich
damit die seltene Gelegenheit zu sehen, welche Ergebnisse die besten
Forschungsgruppen weltweit auf den "eigenen" Dokumenten erzielen.
Voraussetzung ist allerdings, dass die Dateien frei zur Verfuegung
stehen - sie werden Teil des Datensets sein, das dann auf Zenodo
(http://zenodo.org/) der weiteren Forschung zur Verfuegung gestellt
werden wird.
Falls Sie Interesse haben, bitte ich Sie mich direkt zu kontaktieren:
Guenter Muehlberger <guenter.muehlberger@xxxxxxxxxx>
Mit den besten Gruessen,
guenter muehlberger
--
Mag. Dr. Guenter Muehlberger
Innsbruck University
Digitisation and Digital Preservation (DEA)
Innrain 52 / 6020 Innsbruck / Austria
Phone: ++43-512-507-8454
http://germanistik.uibk.ac.at/dea/
http://read.transkribus.eu/
Listeninformationen unter http://www.inetbib.de.