[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Hinweise erbeten: Maschinelle Verarbeitung vonLiteraturlisten (Referenzen)
- Date: Tue, 4 Mar 2008 12:52:57 +0100
- From: "Dietmar Bussmann" <dbussman@xxxxxxx>
- Subject: Re: [InetBib] Hinweise erbeten: Maschinelle Verarbeitung vonLiteraturlisten (Referenzen)
Lieber Herr Weichselgartner,
zwei Hinweise:
a) Dienstleister
z.B. das Satzrechenzentrum in Berlin , Kontakt Frau Fischer oder Herr Stahl.
http://www.srz.de
b) Software:
http://www.primerecognition.com/
Primerecognition koennen Sie selbst betreiben oder in den USA Scannen lassen.
Die Ergebnisse sind um KLASSEN besser als die Ergebnisse bei normalen Desktop -
Produkte bekommen.
Primerecognition ist für mein Dafürhalten das beste Produkt am Markt, nennt aber
keine
Referenzkunden in Deutschland. Die OCR - Ergebnisse sprechen aber für sich.
Grundsätzlich sind die Ergebnisse natuerlich stark von den Vorlagen abhängig und
über welche Mengen gesprochen wird.
Mit freundlichen Grüssen
D.Bussmann
--
Dietmar Bussmann
Max Planck Institute for Comparative Public Law
and International Law
Im Neuenheimer Feld 535; D-69120 Heidelberg
Phone: +49 6221 482 273; Fax: +49 6221 482 278
-----Original Message-----
From: inetbib-bounces@xxxxxxxxxxxxxxxxxx
[mailto:inetbib-bounces@xxxxxxxxxxxxxxxxxx] On Behalf Of Erich Weichselgartner
Sent: Tuesday, March 04, 2008 12:27 PM
To: Internet in Bibliotheken
Subject: [InetBib] Hinweise erbeten: Maschinelle Verarbeitung vonLiteraturlisten
(Referenzen)
Liebe Liste,
im Rahmen eines Projektes möchten wir Literaturlisten (Referenzen)
maschinell erfassen (Scannen, OCR, Strukturanalyse, Extraktion der
Teileinheiten). Beispiel:
Literaturliste (Ausschnitt)
Luck, S.J., & Vogel, E.K. (1997). The capacity of visual working memory
for features and conjunctions. Nature, 390, 279-281.
Miller, G.A. (1956). The magical number seven, plus or minus two: Some
limits on our capacity for processing information. Psychological Review,
63, 82-97.
Erfassung und Zerlegung
a) Die Literaturliste wird gescannt (Tipps für Scanner und Bildparameter
willkommen!)
b) OCR-Erkennung (Abbyy?)
c) Strukturanalyse und Zerlegung der Liste in einzelne Referenzen (im
Beispiel zwei Stück)
d) Zerlegung einer Referenz in ihre Teileinheiten.
Am Beispiel oben: Autor 1 = Luck, S.J.; Autor 2 = Vogel, E.K.; Jahr =
1997; Titel = The capacity of visual working memory for features and
conjunctions; Zeitschrift = Nature; Band = 390; Seiten = 279-281.
Meine Fragen: Gibt es schon fertige Lösungen dieser Art (Scannen, OCR,
Parsen)? Falls nicht, welche Institute (oder Firmen) im Bereich
Bildverarbeitung/Mustererkennung besitzen Expertise für diese Aufgabe?
Wer hätte evtl. Interesse (ggf. als Auftrag)?
Für Hinweise wäre ich sehr dankbar.
Mit freundlichen Grüßen,
Erich Weichselgartner
wga@xxxxxxx
Listeninformationen unter http://www.inetbib.de.