[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Hinweise erbeten: Maschinelle Verarbeitung von Literaturlisten (Referenzen)



-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Sehr geehrter Herr Weichselgartner,

die Editura GmbH ist ein Dienstleister, der auf Probleme wie Ihres bei
hohen Qualitätsanforderungen und großen Volumina spezialisiert ist.

Üblicherweise kombinieren wir bei solchen Aufgabenstellungen den Einsatz
von OCR und Parser mit der Redaktion durch unsere Mitarbeiter, da nach
unserer Erfahrung keine technische Lösung zu 100% zufriedenstellende
Ergebnisse liefert.

Ich würde mich freuen, wenn Sie Kontakt zu mir aufnehmen würden, um
Details zu besprechen.

Für Fragen und weitere Informationen stehe ich Ihnen selbstverständlich
gern zur Verfügung.

Mit freundlichen Grüßen,

Stefan Krause
- ----------------------------------------------
Editura Gesellschaft für Verlagsdienstleistungen mbH
Möckernstraße 68
10965 Berlin
Telefon +49 (030) 78 90 46-66
Telefax +49 (030) 78 90 46-97
E-Mail stefan.krause@xxxxxxxxxx

Eingetragen im Handelsregister Berlin-Charlottenburg
Registernummer: HR B 81823

Vertretungsberechtigte Gesellschafter:
Ralf Szymanski, Erwin Jurschitza

USt.Id. DE217180548

Erich Weichselgartner schrieb:
Liebe Liste,

im Rahmen eines Projektes möchten wir Literaturlisten (Referenzen)
maschinell erfassen (Scannen, OCR, Strukturanalyse, Extraktion der
Teileinheiten). Beispiel:

Literaturliste (Ausschnitt)

Luck, S.J., & Vogel, E.K. (1997). The capacity of visual working memory
for features and conjunctions. Nature, 390, 279-281.

Miller, G.A. (1956). The magical number seven, plus or minus two: Some
limits on our capacity for processing information. Psychological Review,
63, 82-97.

Erfassung und Zerlegung

a) Die Literaturliste wird gescannt (Tipps für Scanner und Bildparameter
willkommen!)

b) OCR-Erkennung (Abbyy?)

c) Strukturanalyse und Zerlegung der Liste in einzelne Referenzen (im
Beispiel zwei Stück)

d) Zerlegung einer Referenz in ihre Teileinheiten.
Am Beispiel oben: Autor 1 = Luck, S.J.; Autor 2 = Vogel, E.K.; Jahr =
1997; Titel = The capacity of visual working memory for features and
conjunctions; Zeitschrift = Nature; Band = 390; Seiten = 279-281.

Meine Fragen: Gibt es schon fertige Lösungen dieser Art (Scannen, OCR,
Parsen)? Falls nicht, welche Institute (oder Firmen) im Bereich
Bildverarbeitung/Mustererkennung besitzen Expertise für diese Aufgabe?
Wer hätte evtl. Interesse (ggf. als Auftrag)?

Für Hinweise wäre ich sehr dankbar.

Mit freundlichen Grüßen,
Erich Weichselgartner
wga@xxxxxxx




-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.6 (MingW32)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iD8DBQFHzalY6m+l2LO+BGwRAhJdAKC5PWRQq37ci/kH4t5yLqQc3HquogCgg4ZR
9ZfIc7H665Rhbf8ksvmwl3g=
=9LJC
-----END PGP SIGNATURE-----



Listeninformationen unter http://www.inetbib.de.