[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Bibliothekskatalog / Suchmaschine
Bibliothekskatalog und Suchmaschine : Was sind die Unterschiede?
Wieder und wieder werden Kataloge und Suchmaschinen in einem
Aepfel-mit-Birnen-Vergleich nebeneinander gehalten. Nicht immer
geschieht das direkt, manchmal nur durch Anspielungen, es kommt
aber immer oefter heraus, dass die Aepfel sich mal eine Scheibe
von den Birnen abschneiden sollten.
In Gespraechen und auch in Zuschriften an mich direkt zeigt sich
oefters, dass es immer noch Missverstaendnisse und daher
auch Aufklaerungsbedarf gibt.
Deshalb hier eine kurze Liste von 11 praegnanten Merkmalen.
Sicher gibt es noch mehr, vielleicht noch wichtigere.
Waere es nicht gut, diese Liste einmal zu diskutieren, zu revidieren
und zu komplettieren, damit man diese Dinge fuer den Alltag
parat hat? Man sollte wohl gegenueber Nutzern etwas Substantielles zu
dem Thema sagen koennen, und da waere es schon gut, wenn nicht der
eine dies und der andere jenes sagen wuerde.
Kritik, Aenderungen und Erweiterungen dieser Liste sind sehr
erwuenscht, es ist nur ein erster Entwurf! Gibt es dergleichen schon
anderswo? (Bei Google und Wisenut nichts gefunden)
Nebenbei:
Jeder benutzt das Wort "Suchmaschine", es ist schon eine stark
abgegriffene Wortmuenze, aber meint jeder dasselbe, oder wo ist es
definiert? Ist es ein Oberbegriff, der "OPAC" mit einschliesst? Ist
der KVK eine? Manchmal wird das so gesagt, aber ist das sinnvoll?
Hier jedenfalls, fuer den Vergleich, sind nur Google, Altavista und
vergleichbare Kandidaten gemeint, also eine engere Auslegung.
(Zur Begriffsverwirrung kommt hinzu, dass mit "Webkatalog" Dinge
wie Yahoo gemeint sind, und keinesfalls Bibliothekskataloge.)
Die Absicht ist nicht, das eine gegenueber dem anderen
schlecht zu machen oder zu loben (vielleicht erscheint es so), aber
Vor- und Nachteile sollten klar herauskommen.
Bibliothekskatalog:
-------------------
1. Beschreibt einen konkreten Dokumentenbestand, in der Mehrzahl
Buecher, der an einem oder mehreren Orten physisch vorliegt.
2. Der Bestand ist in jedem Fall eine Auswahl aus einer
viel groesseren Menge von Dokumenten. Die Auswahl erfolgt
meist nach sachlichen und bewertenden Kriterien, kann aber
durchaus subjektiv beeinflusst sein.
3. Der Bestand ist daher kleiner als er nach der Vorstellung
der meisten Nutzer wuenschenswert waere.
4. Besteht aus Kurzbeschreibungen (Titelaufnahmen), die nach
festgelegten Regeln einheitlich angefertigt werden
5. Die Beschreibungen beruhen im Wesentlichen auf einer Titelseite
oder einem Aequivalent und umfassen keine weiteren Teile des
Inhalts.
Diese Struktur ist an den frueheren Katalogkarten orientiert.
6. Abfragen koennen nach mehreren verschiedenen Kriterien und auch
Kombinationen davon erfolgen: Namen/Titelwoerter/Titelanfaenge/
Schlagwoerter u.a., oft gibt es auch einen "Basic Index", der
alle diese Elemente zusammenfasst.
7. Statt einer direkten Abfrage kann auch ueber das Blaettern in
diversen Registern gesucht werden. Dies wird von Praktikern
fuer unverzichtbar gehalten.
8. Die Ordnung von Ergebnislisten erfolgt nach dem Alphabet der
Verfasser, der Titel, oder nach dem Erscheinungsjahr.
9. Es gibt Normierungen fuer die wichtigsten Datenelemente
(Namen, Einheitstitel, Schlagwoerter)
10. Hat genau definierte Ziele (RAK 101), wodurch es moeglich
ist, nach einem oder wenigen Versuchen so gut wie sicher
zu sein, ob das Gesuchte da ist oder nicht, jedenfalls fuer
bestimmte Arten von Fragestellungen, auch wenn die Schreibweisen
der Woerter oder Namen in den Dokumenten unsicher sind.
M.a.W.: bestimmte Abfragen haben eine hohe Praezision.
11. Formale und sachliche Suche sind zu unterscheiden, denn
meistens gibt es dafuer unterschiedliche Suchmethoden
(verschiedene Register). Wobei die sachliche Erschliessung
selten auch nur annaehernd vollstaendig den Bestand
erschliesst (nicht jedes Dokument ist verschlagwortet)
12. Ein gefundenes Dokument ist mit hoher Sicherheit auch vorhanden
und zugaenglich - moeglicherweise aber ausgeliehen und dann
nicht sofort erhaeltlich.
Suchmaschine:
-------------
1. Indexiert Dokumente, die weltweit verteilt sind
2. Umfang und Aktualitaet des Bestands sind nicht erkennbar, die
Auswahlkriterien sind rein formal,
3. Die indexierte Menge ist daher viel groesser, als ein Nutzer
es sich vorstellt, aber wertvolle Ressourcen stehen
undifferenziert inmitten Massen ephemeren und voellig
unbedeutenden Materials. Es wird versucht, mit formalen
Kriterien eine Gewichtung durchzufuehren.
4. Normierte Beschreibungen der Dokumente gibt es nicht, die Datenbank
besteht eigentlich nur aus grossen Indexdateien (die als solche
jedoch nicht zu sehen sind). Einheitlichkeit ist nicht moeglich,
weil das Material in keiner Hinsicht standardisiert ist.
5. In den Indexdateien ist das gesamte (!) Wortmaterial
der Volltexte (!) aufbereitet. So etwas wie Titelseiten, ja
sogar Titel gibt es oft gar nicht. Deshalb wird per Software
versucht, die jeweils entscheidenden Zeilen eines
Dokuments fuer die Anzeige aufzubereiten, um den Kontext
der gefundenen Woerter sichtbar zu machen.
6. Abfragen werden meistens durch Volltextsuche im gesamten Bestand
erledigt, wofuer ein einzelnes Eingabefeld genuegt. Es sind
meist auch gewisse Differenzierungen der Abfrage moeglich, doch
z.B. nicht nach Namen/Stichwoertern/Titeln/Schlagwoertern,
weil es dazu keine Datenfelder gibt.
7. Register zum Blaettern gibt es bei keiner bekannten Suchmaschine.
Dies wird zwar selten bemaengelt, aber gerade wegen der voellig
fehlenden Normierung der Datenelemente koennten solche Register
gelegentlich sehr helfen. Die gewaltigen Datenmengen und die
Art der Daten- und Indexorganisation (es gibt gar keine Felder!)
erlaubt aber solche Register wohl nicht.
8. Die Ordnung der Ergebnisse wird nach sehr unterschiedlichen
Kriterien vorgenommen, die selten direkt nachvollziehbar
sind. Oft ist von "Relevanz" die Rede, wobei uebersehen
wird, dass Relevanz subjektiv ist und deshalb grundsaetzlich
nicht von Maschinen klassifiziert werden kann.
Ordnungen nach Alphabet oder Jahr sind nicht moeglich, weil
die notwendigen Metadaten dafuer nicht vorliegen. (Z.B. ist
das Erstellungsjahr der Datei in einem HTML-file
standardmaessig nicht enthalten.)
9. Es gibt keine Normierungen, denn Erfassung und Indexierung erfolgen
vollautomatisch - manuell/intellektuell sind die Mengen
nicht zu bewaeltigen.
Der Mangel an Normierungen fuehrt dazu, dass praezise
Ergebnisse nur dann moeglich sind, wenn man genau weiss,
dass bestimmte Namen/Woerter mit Sicherheit in einer ganz
bestimmten Schreibweise in den Dokumenten vorkommen.
10. Prinzipien fuer die Ziele einer Suchmaschine waeren schwierig
zu formulieren, jedenfalls in dem Sinne, dass man wuesste,
welche Art von Zugriffen Ergebnisse mit hoher Praezision
erbringen wuerden.
11. Die sachliche Suche steht im Vordergrund des Interesses,
doch auch formale Suchen (schnell mal die URL finden
von xyz) finden sehr oft statt. Eine Unterscheidung gibt
es auf Software-Ebene nicht, weil keine entsprechenden
Datenelemente vorhanden sind: Verschlagwortung gibt es
nicht, doch die Volltextsuche gleicht das in gewisser
Weise aus.
12. Ein gefundenes Dokument ist i.r.R. sofort zugaenglich,
manchmal aber nicht oder nicht mehr vorhanden oder nicht
sofort auffindbar. (Dem wuerde es entsprechen, wenn eine
Bibliothek staendig Signaturen aendern, diese Aenderungen
aber nicht oder mit Verzoegerung im Katalog nachvollziehen
wuerde.)
Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329,
D-38023 Braunschweig, Germany
Tel. +49 531 391-5026 , -5011 , FAX -5836
e-mail B.Eversberg _at__ tu-bs.de
Listeninformationen unter http://www.inetbib.de.