[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] Hinweise erbeten: Maschinelle Verarbeitung von Literaturlisten (Referenzen)



Liebe Liste,

im Rahmen eines Projektes möchten wir Literaturlisten (Referenzen)
maschinell erfassen (Scannen, OCR, Strukturanalyse, Extraktion der
Teileinheiten). Beispiel:

Literaturliste (Ausschnitt)

Luck, S.J., & Vogel, E.K. (1997). The capacity of visual working memory
for features and conjunctions. Nature, 390, 279-281.

Miller, G.A. (1956). The magical number seven, plus or minus two: Some
limits on our capacity for processing information. Psychological Review,
63, 82-97.

Erfassung und Zerlegung

a) Die Literaturliste wird gescannt (Tipps für Scanner und Bildparameter
willkommen!)

b) OCR-Erkennung (Abbyy?)

c) Strukturanalyse und Zerlegung der Liste in einzelne Referenzen (im
Beispiel zwei Stück)

d) Zerlegung einer Referenz in ihre Teileinheiten.
Am Beispiel oben: Autor 1 = Luck, S.J.; Autor 2 = Vogel, E.K.; Jahr =
1997; Titel = The capacity of visual working memory for features and
conjunctions; Zeitschrift = Nature; Band = 390; Seiten = 279-281.

Meine Fragen: Gibt es schon fertige Lösungen dieser Art (Scannen, OCR,
Parsen)? Falls nicht, welche Institute (oder Firmen) im Bereich
Bildverarbeitung/Mustererkennung besitzen Expertise für diese Aufgabe?
Wer hätte evtl. Interesse (ggf. als Auftrag)?

Für Hinweise wäre ich sehr dankbar.

Mit freundlichen Grüßen,
Erich Weichselgartner
wga@xxxxxxx






Listeninformationen unter http://www.inetbib.de.