[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

dandelon.com - ein Update



Liebe Liste,

in diesem Sommer haben mehrere Bibliotheken sich für den Einsatz von
intelligentCAPTURE entschieden - somit ist das Produkt in vier Staaten
präsent. Überall dort wird Content für das gemeinsame, öffentlich frei
zugängliche und kostenlose dandelon.com generiert. Der GBV wird seine
Unterstützung und Nutzung weiter ausbauen.

Die aktuelle Anzahl von Titeln in dandelon.com beträgt derzeit ca. 20.000
Titel (Inhaltsverzeichnisse maschinell ausgewertet). Ab Oktober werden ca.
zehn Bibliotheken ihren Input an dandelon.com liefern. Gerade in Arbeit bei
den Software-Entwicklern ist die Integration von Verlagsdaten von Springer.

Weitere Neuigkeiten aus der Entwicklung:

Eines der Null-Treffer-Probleme in OPACs sind bekanntlich "falsche"
Wortformen von Benutzern. Wir haben für Deutsch ein zusätzliche
Konvertierung von Plural auf Singular eingebaut und suchen dann mit beidem
- sowohl in den Thesauri als auch in den Medien. Die Suchlogik passt sich
jetzt dynamisch dem Suchergebnis an: Jede Frage wird analysiert: sind es
mehrere Suchworte, wird geprüft, ob es eine Phrase ist  oder ob ein
Operatur "fehlt". Wenn es keine Phrase ist, wird "AND" als Operator
genutzt, d.h. alle Suchbegriffe (oder semantische assozierte Terme) müssen
vorkommen.  Wenn kein Suchergebnis generiert werden kann, werden
automatisch zusätzlich Unterbegriffe zugeschaltet und weitere Suchfelder
genutzt. Wenn dann immer noch kein Ergebnis vorliegt, wird die Suche über
alle Felder und die Zuschaltung von Fuzzy-Search oder Wortstammsuche
(einstellbar) fortgesetzt.
Wenn das alles nichts hilft, kann der Benutzer in den "Topic Maps" mittels
graphischer Visalisierung nach weiteren assoziativ vernetzten Begriffen
Ausschau halten. Bei der Navigation in den Topic Maps wird automatisch eine
Wortstammsuche (gleichzeitige Links- und Rechtstrunkierung) ausgeführt, und
alle möglichen Terme werden angezeigt. Hier ist das Feld weiter gewachsen,
der INFODATA-Thesaurus zum Thema Informationswissenschaft kam hinzu.
Aktuell wird der Umweltthesaurus des Bundesumweltamtes portiert. Wirtschaft
direkt danach.

Die Ergebnisanzeige wurde beschleunigt, die direkte Sortierung von
Suchergebnissen nach Jahr oder Autor direkt in die Anzeige eingebaut.

Ab Mitte September beginnt das Spidering und die maschinelle Indexierung
von Fachzeitschriftenartikeln aus kostenpflichten eJournals. Wer
elektronsche Zugangsrechte über SwetsScan besitzt, kann die Volltexte
direkt sehen, andere sehen nur das maschinelle Indexat und die Abstracts.
Einige (noch wenige) Quellen sind kostenlos und im Volltext verfügbar.
Weitere Quellen - wohl erste Open Archives -  baldmöglichst. Je mehr
Bibliotheken in intelligentCAPTURE als Produktionssystem einsteigen, desto
schneller und breiter wächst das Angebot.

Neu in diesem Sommer auch die Buchkauf-Option - in Partnerschaft mit der
Bremer Versandbuchhandlung Missing Link.

Später im Herbst/Winter geplant: maschinell gespidertes und indexiertes
Verzeichnis von Forschungsinstituten, Fakultäten, Fachbereichen, Teams,
forschenden Unternehmen. Technisch schon ziemlich fertig. Ein sehr
schlanker Workflow wird gerade erprobt.


Schließlich etwas für uns selbst, die Information Professionals:
neu im Sommer das "Portal Informationswissenschaft" - ein noch "kleiner
Bruder" zu dandelon.com unter http://www.dgi-info.de. Es soll der gesamten
Informationswirtschaft als eine wissenschaftliche Plattform dienen. Derzeit
mit Inhalten der DGI - weitere Quellen sind jederzeit willkommen. Schön
wären hier die Aufsätze des Österreichischen und Deutschen
Bibliothekartags, der ISI 2004 und ähnlicher Konferenzen. Aus der
Verbandszeitschrift der DGI "Informationen - Wissenschaft und Praxis"
wurden erste ausgewählte Artikel aufgenommen. Andere Zeitschriften sind
willkommen. Auch ein automatische Spidering und Indexierung nach Thesaurus
Informationswissenschaft von E-LIS soll kommen. Gespidert wurden die
Aussteller der ComInfo - eingschlägige Anbieter von Diensten und Software
für Information Professionals (Buttons "Websites"). Weitere sollen folgen -
es fehlt vor allem noch an redaktioneller Manpower. Ein kleines Team hat
sich vorgenommen, den "INFODATA - Thesaurus Informationswissenschaft"
fortzuschreiben und zu übersetzen. Er soll dann für die automatische
Indexierung genutzt werden.


Mit freundlichem Gruß
Manfred Hauer


AGI - Information Management Consultants
Dipl.-Inf.wiss. Manfred Hauer M.A.
Mandelring 238 b
67433 Neustadt / Weinstrasse
+49 6321 96 35 - 10
Manfred.Hauer@xxxxxxxxxx
http://www.agi-imc.de
http://www.dandelon.com


Listeninformationen unter http://www.inetbib.de.