[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: inetbib-digest V1 #481 Sacherschließung: Anreicherung von Bibliothekskatalogen



Liebe Liste,

Herr Graf stellt einige Soll-Ziele auf, zu denen ich bezüglich
intelligentCAPTURE als Produktionssystem und http://www.dandelon.com als
öffentlicher Service kurz eingehen will:

>1. Frei zugaengliche OPACs sind Teil eines
>bibliographischen Verbunds. Ihnen kommt daher ueberlokale
>Bedeutung zu: sie koennen und sollen fuer Nicht-Kunden
>bibliographische Recherchen ermoeglichen, ihre Funktion
>erschoepft sich nicht darin, nicht nur den lokalen Bestand
>nachweisen.

dandelon.com ist ein offener INTERNATIONALER Service, der zwar
bisher nur Daten aus der Vorarlberger Landesbibliothek enthält,
eine erste deutsche Bibliothek ist mit intelligentCAPTURE aus-
gerüstet und wird hoffentlich bald erst Daten liefern. Sehr wahrscheinlich
kommen bis Sommer weitere Bibliotheken in Schweiz, Österreich und
Deutschland hinzu. Von der Recherche dort wird es jeweils eine
Durchschaltung auf die Bibliothekskataloge zwecks ausleihe geben,
für Bregenz gilt dies schon.

Den Inhalt bestimmen die liefernden Bibliotheken. Die Durchschaltbarkeit
hängt vom jeweiligen lokalen Bibliothekssystem ab.


>2. Angereicherte Inhalte muessen nach den Grundsaetzen des
>Open Access zur Verfuegung stehen.

Dandelon.com ist kein kommerzielles Angebot, der Zugang ist
für jedermann frei und kostenlos. Technisch läuft
der Server in Göttingen beim GBV, er wird aber allein von
AGI - Information Management Consultants betrieben. Der GBV
wird demnächst Links in seinen Katalog auf PDF-Dateien in
dandelon.com anbieten können.

Der Inhalt fließt aus intelligentCAPTURE, dem Produktions-
system in die jeweiligen lokalen Bibliothekskataloge und
bei "shareable" Content in dandelon.com. Die Aufsatzver-
arbeitung bei FIZ Technik wird nicht "geshared",
sondern exklusiv von FIZ Technik vermarktet.

Eine automatisches Spidern von eJournal-Artikeln kommt in
Kürze. Nur Bibliotheken, die über ihre IP-Nummer das Recht
zum Durchgriff auf den Volltext haben, können in der Produktion
mitmachen - und nur deren Kunden können auch den Volltext direkt
öffnen. Nicht die Artikel, sondern nur deren maschinell
generierten Indexate, stehen dann in dandelon.com bereit. Technisch
wird aber der Link auf den Artikel sofort ausgeführt und im
rechten Frame angezeigt - wenn die Rechte des Benutzers ausreichen.

Die Zeitschriftendatenbank mit 16.000 Titeln ist vorläufig fertig,
aber noch nicht intergriert. Ziel Mai.

>3. Die Anreicherung ist kooperativ und moeglichst
>dublettenfrei zu organisieren, moeglichst im
>internationalen Kontext.

genau dies ist unser Weg


>4. Wer Inhaltsverzeichnisse und anderen "enriched content"
>einbringt, darf nicht auf halbem Wege stehen bleiben und
>muss sie suchbar machen.

dandelon.com ist zuallerst (für die Öffentlichkeit) eine
Search Engine. Wir haben eine semantische Expansion von Fragen.
Derzeit sind 360.000 semantisch vernetzte Terme in bis zu
fünf Sprachen implementiert (Medizin, Recht, Logistik, Banking,
Versicherung, Management, Technik, Telecom, Chemie).
Eine Reihe weiterer "Domänen" sind angefragt: Wirtschaft,
Sozialwissenschaft, Psychologie, Informationswissenschaft,
Umwelt.
Dahinter steht der Ansatz, ein Medium aus der Perspektive von
mehreren Fachgebieten = Domänen zu betrachten. Eine DDC oder SWD ist
letztlich auch nur eine eher allgemeine Perspektive - neben
vielen möglichen speziellen Perspektiven. Gerne würden wir die
SWD einarbeiten, bislang wird Sie uns verweigert.

Demnächst kommt die automatische Umsetzung der Suchworte des Benutzers
von Singular oder Plural hinzu. (Zuerst deutsch). US-Thesauri
verwenden meist den Plural als Ansetzungform, DIN sieht den Singular
als Norm.

Wir feilen an der maschinellen Indexierung seit 20 Jahren
und wenden diese zunehmend Domänen-spezifisch an, eine Domäne
wird dabei durch einen Thesaurus repräsentiert. Dies ist
notwendig, um hochwertige Rechercheergebnisse
anzubieten. Das optimale Ranking im Retrieval-Ergebnis ist
das Ziel - und das Ergebnis bis heute, kann sich wohl
sehen lassen. Dennoch, die Feinjustierung wird wohl nie enden.
Unser Retrieval ist sehr schnell, derzeit verschwenden wir für
Sortierung und Highlighting noch zu viel Zeit - wird sich ändern.
Doch das Bohren von dicken Brettern braucht Zeit - und gute Ideen.

>Sinnvoll ist es, Suchmoeglichkeiten zu schaffen, die sich
>exklusiv auf den enriched content beziehen bzw. auf
>denjenigen Anteil des Katalogs, der unselbstaendige
>Literatur erschliesst.
schon erledigt

Und wer es nicht glaubt, soll doch einfach alternativ im eigenen Katalog
und
dannach bei http://www.dandelon.com recherchieren.  Noch finden sich hier
keine Millionen, sondern erst 16.000 Titel der letzten Jahre. Doch teils
findet
man hier mehr und gezielter als in 30 Millionen Titeln deutschsprachiger
Bibliotheken
vereint im KVK.

Woher kommt das Geld? Aus dem Verkauf von intelligentCAPTURE an
Bibliotheken und  Dokumentationszentren in Staat, Wissenschaft und
Wirtschaft
und aus dem Aufbau oder mehrsprachigen Ausbau von Fachthesauri mit IC
INDEX.
Testlizenz: 2500 EURO zzgl. MwSt. inklusive Scanner. Anruf erwünscht.

Manfred Hauer


AGI - Information Management Consultants
Dipl.-Inf.wiss. Manfred Hauer M.A.
Mandelring 238 b
67433 Neustadt / Weinstrasse
+49 6321 96 35 - 10
Manfred.Hauer@xxxxxxxxxx
http://www.agi-imc.de
http://www.dandelon.com


Listeninformationen unter http://www.inetbib.de.