-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Sehr geehrter Herr Weichselgartner, die Editura GmbH ist ein Dienstleister, der auf Probleme wie Ihres bei hohen Qualitätsanforderungen und großen Volumina spezialisiert ist. Üblicherweise kombinieren wir bei solchen Aufgabenstellungen den Einsatz von OCR und Parser mit der Redaktion durch unsere Mitarbeiter, da nach unserer Erfahrung keine technische Lösung zu 100% zufriedenstellende Ergebnisse liefert. Ich würde mich freuen, wenn Sie Kontakt zu mir aufnehmen würden, um Details zu besprechen. Für Fragen und weitere Informationen stehe ich Ihnen selbstverständlich gern zur Verfügung. Mit freundlichen Grüßen, Stefan Krause - ---------------------------------------------- Editura Gesellschaft für Verlagsdienstleistungen mbH Möckernstraße 68 10965 Berlin Telefon +49 (030) 78 90 46-66 Telefax +49 (030) 78 90 46-97 E-Mail stefan.krause@xxxxxxxxxx Eingetragen im Handelsregister Berlin-Charlottenburg Registernummer: HR B 81823 Vertretungsberechtigte Gesellschafter: Ralf Szymanski, Erwin Jurschitza USt.Id. DE217180548 Erich Weichselgartner schrieb:
Liebe Liste, im Rahmen eines Projektes möchten wir Literaturlisten (Referenzen) maschinell erfassen (Scannen, OCR, Strukturanalyse, Extraktion der Teileinheiten). Beispiel: Literaturliste (Ausschnitt) Luck, S.J., & Vogel, E.K. (1997). The capacity of visual working memory for features and conjunctions. Nature, 390, 279-281. Miller, G.A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 63, 82-97. Erfassung und Zerlegung a) Die Literaturliste wird gescannt (Tipps für Scanner und Bildparameter willkommen!) b) OCR-Erkennung (Abbyy?) c) Strukturanalyse und Zerlegung der Liste in einzelne Referenzen (im Beispiel zwei Stück) d) Zerlegung einer Referenz in ihre Teileinheiten. Am Beispiel oben: Autor 1 = Luck, S.J.; Autor 2 = Vogel, E.K.; Jahr = 1997; Titel = The capacity of visual working memory for features and conjunctions; Zeitschrift = Nature; Band = 390; Seiten = 279-281. Meine Fragen: Gibt es schon fertige Lösungen dieser Art (Scannen, OCR, Parsen)? Falls nicht, welche Institute (oder Firmen) im Bereich Bildverarbeitung/Mustererkennung besitzen Expertise für diese Aufgabe? Wer hätte evtl. Interesse (ggf. als Auftrag)? Für Hinweise wäre ich sehr dankbar. Mit freundlichen Grüßen, Erich Weichselgartner wga@xxxxxxx
-----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.6 (MingW32) Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org iD8DBQFHzalY6m+l2LO+BGwRAhJdAKC5PWRQq37ci/kH4t5yLqQc3HquogCgg4ZR 9ZfIc7H665Rhbf8ksvmwl3g= =9LJC -----END PGP SIGNATURE-----