[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Bibliothekskatalog / Suchmaschine



Bibliothekskatalog und Suchmaschine : Was sind die Unterschiede?

Wieder und wieder werden Kataloge und Suchmaschinen in einem
Aepfel-mit-Birnen-Vergleich nebeneinander gehalten. Nicht immer
geschieht das direkt, manchmal nur durch Anspielungen, es kommt
aber immer oefter heraus, dass die Aepfel sich mal eine Scheibe 
von den Birnen abschneiden sollten.
In Gespraechen und auch in Zuschriften an mich direkt zeigt sich
oefters, dass es immer noch Missverstaendnisse und daher 
auch Aufklaerungsbedarf gibt.
Deshalb hier eine kurze Liste von 11 praegnanten Merkmalen.
Sicher gibt es noch mehr, vielleicht noch wichtigere.
Waere es nicht gut, diese Liste einmal zu diskutieren, zu revidieren
und zu komplettieren, damit man diese Dinge fuer den Alltag
parat hat? Man sollte wohl gegenueber Nutzern etwas Substantielles zu 
dem Thema sagen koennen, und da waere es schon gut, wenn nicht der
eine dies und der andere jenes sagen wuerde.
Kritik, Aenderungen und Erweiterungen dieser Liste sind sehr
erwuenscht, es ist nur ein erster Entwurf! Gibt es dergleichen schon 
anderswo? (Bei Google und Wisenut nichts gefunden)

Nebenbei:
Jeder benutzt das Wort "Suchmaschine", es ist schon eine stark 
abgegriffene Wortmuenze, aber meint jeder dasselbe, oder wo ist es 
definiert? Ist es ein Oberbegriff, der "OPAC" mit einschliesst? Ist 
der KVK eine? Manchmal wird das so gesagt, aber ist das sinnvoll?
Hier jedenfalls, fuer den Vergleich, sind nur Google, Altavista und
vergleichbare Kandidaten gemeint, also eine engere Auslegung.
(Zur Begriffsverwirrung kommt hinzu, dass mit "Webkatalog" Dinge
wie Yahoo gemeint sind, und keinesfalls Bibliothekskataloge.)

Die Absicht ist nicht, das eine gegenueber dem anderen
schlecht zu machen oder zu loben (vielleicht erscheint es so), aber 
Vor- und Nachteile sollten klar herauskommen.

Bibliothekskatalog:
-------------------
1. Beschreibt einen konkreten Dokumentenbestand, in der Mehrzahl
      Buecher, der an einem oder mehreren Orten physisch vorliegt.
2. Der Bestand ist in jedem Fall eine Auswahl aus einer
      viel groesseren Menge von Dokumenten. Die Auswahl erfolgt
      meist nach sachlichen und bewertenden Kriterien, kann aber
      durchaus subjektiv beeinflusst sein.
3. Der Bestand ist daher kleiner als er nach der Vorstellung
      der meisten Nutzer wuenschenswert waere.
4. Besteht aus Kurzbeschreibungen (Titelaufnahmen), die nach
      festgelegten Regeln einheitlich angefertigt werden
5. Die Beschreibungen beruhen im Wesentlichen auf einer Titelseite
      oder einem Aequivalent und umfassen keine weiteren Teile des 
      Inhalts.
      Diese Struktur ist an den frueheren Katalogkarten orientiert.
6. Abfragen koennen nach mehreren verschiedenen Kriterien und auch
      Kombinationen davon erfolgen: Namen/Titelwoerter/Titelanfaenge/
      Schlagwoerter u.a., oft gibt es auch einen "Basic Index", der
      alle diese Elemente zusammenfasst.
7. Statt einer direkten Abfrage kann auch ueber das Blaettern in
      diversen Registern gesucht werden. Dies wird von Praktikern
      fuer unverzichtbar gehalten.
8. Die Ordnung von Ergebnislisten erfolgt nach dem Alphabet der
      Verfasser, der Titel, oder nach dem Erscheinungsjahr.
9. Es gibt Normierungen fuer die wichtigsten Datenelemente
      (Namen, Einheitstitel, Schlagwoerter)
10. Hat genau definierte Ziele (RAK 101), wodurch es moeglich
      ist, nach einem oder wenigen Versuchen so gut wie sicher 
      zu sein, ob das Gesuchte da ist oder nicht, jedenfalls fuer
      bestimmte Arten von Fragestellungen, auch wenn die Schreibweisen
      der Woerter oder Namen in den Dokumenten unsicher sind.
      M.a.W.: bestimmte Abfragen haben eine hohe Praezision.
11. Formale und sachliche Suche sind zu unterscheiden, denn
      meistens gibt es dafuer unterschiedliche Suchmethoden
      (verschiedene Register). Wobei die sachliche Erschliessung 
      selten auch nur annaehernd vollstaendig den Bestand 
      erschliesst (nicht jedes Dokument ist verschlagwortet)
12. Ein gefundenes Dokument ist mit hoher Sicherheit auch vorhanden
      und zugaenglich - moeglicherweise aber ausgeliehen und dann
      nicht sofort erhaeltlich.

Suchmaschine:
-------------
1. Indexiert Dokumente, die weltweit verteilt sind
2. Umfang und Aktualitaet des Bestands sind nicht erkennbar, die
      Auswahlkriterien sind rein formal,
3. Die indexierte Menge ist daher viel groesser, als ein Nutzer
      es sich vorstellt, aber wertvolle Ressourcen stehen
      undifferenziert inmitten Massen ephemeren und voellig 
      unbedeutenden Materials. Es wird versucht, mit formalen
      Kriterien eine Gewichtung durchzufuehren.
4. Normierte Beschreibungen der Dokumente gibt es nicht, die Datenbank
      besteht eigentlich nur aus grossen Indexdateien (die als solche
      jedoch nicht zu sehen sind). Einheitlichkeit ist nicht moeglich,
      weil das Material in keiner Hinsicht standardisiert ist. 
5. In den Indexdateien ist das gesamte (!) Wortmaterial
      der Volltexte (!) aufbereitet. So etwas wie Titelseiten, ja
      sogar Titel gibt es oft gar nicht. Deshalb wird per Software
      versucht, die jeweils entscheidenden Zeilen eines
      Dokuments fuer die Anzeige aufzubereiten, um den Kontext
      der gefundenen Woerter sichtbar zu machen.
6. Abfragen werden meistens durch Volltextsuche im gesamten Bestand
      erledigt, wofuer ein einzelnes Eingabefeld genuegt. Es sind
      meist auch gewisse Differenzierungen der Abfrage moeglich, doch
      z.B. nicht nach Namen/Stichwoertern/Titeln/Schlagwoertern,
      weil es dazu keine Datenfelder gibt.
7. Register zum Blaettern gibt es bei keiner bekannten Suchmaschine.
      Dies wird zwar selten bemaengelt, aber gerade wegen der voellig
      fehlenden Normierung der Datenelemente koennten solche Register
      gelegentlich sehr helfen. Die gewaltigen Datenmengen und die
      Art der Daten- und Indexorganisation (es gibt gar keine Felder!)
      erlaubt aber solche Register wohl nicht.
8. Die Ordnung der Ergebnisse wird nach sehr unterschiedlichen 
      Kriterien vorgenommen, die selten direkt nachvollziehbar 
      sind. Oft ist von "Relevanz" die Rede, wobei uebersehen 
      wird, dass Relevanz subjektiv ist und deshalb grundsaetzlich 
      nicht von Maschinen klassifiziert werden kann.
      Ordnungen nach Alphabet oder Jahr sind nicht moeglich, weil
      die notwendigen Metadaten dafuer nicht vorliegen. (Z.B. ist
      das Erstellungsjahr der Datei in einem HTML-file
      standardmaessig nicht enthalten.)
9. Es gibt keine Normierungen, denn Erfassung und Indexierung erfolgen
      vollautomatisch - manuell/intellektuell sind die Mengen
      nicht zu bewaeltigen.
      Der Mangel an Normierungen fuehrt dazu, dass praezise
      Ergebnisse nur dann moeglich sind, wenn man genau weiss,
      dass bestimmte Namen/Woerter mit Sicherheit in einer ganz
      bestimmten Schreibweise in den Dokumenten vorkommen.
10. Prinzipien fuer die Ziele einer Suchmaschine waeren schwierig
      zu formulieren, jedenfalls in dem Sinne, dass man wuesste,
      welche Art von Zugriffen Ergebnisse mit hoher Praezision
      erbringen wuerden.
11. Die sachliche Suche steht im Vordergrund des Interesses,
      doch auch formale Suchen (schnell mal die URL finden
      von xyz) finden sehr oft statt. Eine Unterscheidung gibt
      es auf Software-Ebene nicht, weil keine entsprechenden
      Datenelemente vorhanden sind: Verschlagwortung gibt es
      nicht, doch die Volltextsuche gleicht das in gewisser
      Weise aus.
12. Ein gefundenes Dokument ist i.r.R. sofort zugaenglich, 
      manchmal aber nicht oder nicht mehr vorhanden oder nicht
      sofort auffindbar. (Dem wuerde es entsprechen, wenn eine 
      Bibliothek staendig Signaturen aendern, diese Aenderungen
      aber nicht oder mit Verzoegerung im Katalog nachvollziehen
      wuerde.)
  


Bernhard Eversberg
Universitaetsbibliothek, Postf. 3329, 
D-38023 Braunschweig, Germany
Tel.  +49 531 391-5026 , -5011 , FAX  -5836
e-mail  B.Eversberg _at__ tu-bs.de  


Listeninformationen unter http://www.inetbib.de.