[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
AW: Zusatzinformationen im OPAC
Liebe Frau Dilber,
Ich habe vor etwa einem Jahr in dieser Liste bereits über unsere Innovation
berichtet (Resonanz fast null, eine Mail dazu ziemlich abwertend und unter
Niveau), die Sache am Österreichischen Bibliothekartag 2002 vorgestellt und in
der DGI-Tagung im Rahmen der ComInfo referiert und wunderte mich zunächst etwas
darüber, dass unser Projekt in der Liste scheinbar nicht zur Kenntnis genommen
wurde oder auf nur wenig Interesse gestoßen ist. Ganz unbemerkt scheint die
Sache aber dann doch nicht geblieben zu sein.
In der Vorarlberger Landesbibliothek werden mittels intelligentCAPTURE seit
einem Jahr die Inhaltsverzeichnisse eingescannt und über eine OCR-Software
digitalisiert und als PDF-Datei in einem Filesystem auf dem Server gespeichert.
Darüber hinaus werden die relevantesten Begriffe über automatische Indexierung
(CAI-Engine) ermittelt und in einer automatisierten und periodisierten Routine
(Job) in unser Bibliothekssystem Aleph importiert und zwar in der Weise, dass
diese begrifflichen Auszüge in ein Abstract-Feld der entsprechenden
bibliografischen Aufnahme in ALEPH importiert und die PDF-Datei mit dem
entsprechenden Dokument in ALEPH verlinkt wird (Schlüssel: Systemnummer bzw.
Barcode).
Es ist wichtig zu bemerken, dass der gesamte Workflow insoferne völlig
automatisiert abläuft, als der manuelle Aufwand sich im Wesentlichen auf das
Einlesen des das Buch identifizierenden EAN-Codes und den anschließenden Kopier-
bzw. Scanvorgang reduziert. Die folgenden Prozesse (Digitalisierung über OCR,
Erstellung der PDF-Datei, Speicherung auf dem Server und Verlinkung mit der
bibliografischen Aufnahme im ALEPH-Katalog.) erfolgen automatisiert im
Hintergrund.
So sind wir in der Lage, mit einer Person - nicht zusätzlich, sondern durch
Umdisponierung freigemacht (dies zur Bemerkung von Herrn Woltering) - praktisch
sämtliche Neuerwerbungen, die von inhaltlicher Relevanz sind, auf diese Weise zu
erfassen (ca. 10 000 pro Jahr).
Die Software "intelligentCAPTURE" wird von AGI-Information Management
Consultants im Dialog mit uns entwickelt.
Sie ist eine vom Bibliothekssystem Aleph vollkommen unabhängige Software und
kann jedes Zielsystem "laden"
Die Fa. AGI hat die Software nun auch insofern erweitert, als jetzt auch
elektronische Dokumente (TIF's, PDF's, HTML, DOC) automatisch in den Workflow
integriert werden können. Dies zielt insbesondere auf Fachaufsätze in eJournals.
Bereits in B.I.T. online Jg. 5 (2002), Nr. 1, S. 49 -50 ("iCapture 1.0 bringt
Inhaltsverzeichnisse in Bibliothekssysteme und verbessert die Recherche") hat
Herr Hauer die Lösung vorgestellt. Ein Artikel in BuB Jg. 55 (2003) Nr. 3, S.
192-196 ist gerade erscheinen und online bei www.AGI-IMC.de verfügbar (oder per
eMail anfordern bei manfred.hauer _at__ agi-imc.de).
Zudem wird unabhängig von Aleph eine Datenbank gespeist. In dieser Datenbank
sind die Inhaltsverzeichnisse zusätzlich zu den über automatische Indexierung
extrahierten (und Richtung Aleph exportierten) Begriffen noch volltextindexiert
(in Aleph derzeit nicht möglich). Zudem sind die von der automatischen
Indexierungsmaschine (CAI) ermittelten Terme nach Relevanz gewichtet (Aleph kann
derzeit damit nichts anfangen). In der Recherche werden diese Gewichte dann im
Ranking instrumentalisiert. Volltext und automatische Indexierung sind dabei
vollkommen integriert.
Auch wichtige Recherchefunktionalitäten wie Fuzzy-Search und Stemming sind
Bestandteil des Retrievals.
Wir werden diese Datenbank in Kürze im Web öffnen, es soll so einfach wie Google
nutzbar sein. Der direkte Link ins Aleph-Dokument wird über die
Aleph-Systemnummer realisiert.
Um keine Missverständnisse aufkommen zu lassen. Die intellektuelle Indexierung
hat nach wie vor ihre Bedeutung. Gerade im Kontext ergeben sich enorme
Synergien. So liefert die intellektuelle Indexierung unter anderem auch wichtige
Parameter für das Ranking. Diese Suchdatenbank wird auch die Einbindung von
Thesauri ermöglichen. Zur Visualisierung eines Thesaurus entsteht eine grafische
Darstellung. Suchbegriffe können durch Thesaurusbegriffsfelder expandiert
werden.
Mit freundlichen Grüßen,
Karl Rädler, Projektleiter
Karl Raedler
Vorarlberger Landesbibliothek
Abteilung Dokumentation
Fluherstraße 4
A-6901 Bregenz
Tel.: +43 5574 511 44014
Fax: +43 5574 511 44095
Mailto: karl.raedler _at__ vlr.gv.at
URL: http://www.vlr.gv.at/vlb
> ----------
> Von: dilber[SMTP:dilber _at__ bib-bvb.de]
> Antwort an: Internet in Bibliotheken
> Gesendet: Donnerstag, 03. April 2003 08:16
> An: Internet in Bibliotheken
> Betreff: Re: Zusatzinformationen im OPAC
>
> Hubert Woltering schrieb:
> >
> > Hallo,
> >
> > hinweisen koennte man auch auf den Hauptkatalog der Vorarlberger
> > Landesbibliothek (http://www.vorarlberg.at/vlb/katalog.htm); dort kann man
> > ueber das Suchfeld "Inhaltsverzeichnis" auch eingescannte
> > Inhaltsverzeichnisse von Titeln (PDF-Format) durchsuchen. Habe es mal mit
> > "Nationalsozialismus" (38 Treffer) und "nationalsoz*" (61 Treffer) versucht:
> > Satznummer anwaehlen, dann auf "Inhaltsverzeichnis" im Feld "Extern" klicken
> > und schon wird bei Existenz des Acrobat Readers die PDF-Datei geoeffnet und
> > kann mit der Suchfunktion des Readers durchsucht werden.
> >
> > Man muss nur eben Finanzen/Arbeitskraft dafuer haben!!!
> >
>
> Das ist ja ganz entzückend.
> Kann mir bitte jemand den Trick verraten, wie man die Stichwörter
> aus dem Inhaltsverzeichnis ins die Titelaufnahme übernimmt?
>
> Edith Dilber (zukünftiger Aleph-Anwender)
> --
> ----------------------------------------------
> Edith Dilber
>
> Bayerische Staatsbibliothek
> Bibliotheks-Verbund Bayern
> D-80328 Muenchen
>
> Tel.: +49-89-28638-2634
> Fax: +49-89-28638-2605
> E-mail: dilber _at__ bib-bvb.de
> ----------------------------------------------
>
Listeninformationen unter http://www.inetbib.de.