[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)



Liebe Frau Dr. Wiesenmüller,
schreiben Sie bloß dieses Lehrbuch. Es wäre eine schöne Sache für Praktiker, 
hier nicht alleine die verteilten Informationen zusammenzusuchen und sich darin 
zurechtzufinden und fit zu machen. Nicht in jeder Bibliothek kann man einen 
Katalogisierungsexperten in Arbeitsgruppen schicken oder intensiv an Schulungen 
und Verbundsitzungen zu dem Thema entsenden. Ein Lehrbuch führt ein, bildet 
Zusammenhänge, bringt Beispiele und jeder kann an der Stelle Informationen 
aufsuchen, die ihm noch fehlt oder durch eine Fortbildung dann auf einem Fundus 
aufbauen. 
Wichtig wäre auch ein Informationsteil mit den verschiedenen 
Informationsquellen, auch wenn dieser veralten wird, alles veraltet irgendwann 
und man muss den Sachstand aktualisieren. 
Ich wünsche viel Erfolg!

Annette Kustos, M.A., M.A.-LIS
Leitung Hochschulbibliothek
Hochschule für Gesundheit
University of Applied Sciences
Universitätsstraße 105
44789 Bochum
Tel: +49 (0)234/77727-150
Mobil: 
E-Mail: annette.kustos@xxxxxxxxxxxxxxxx
Web: www.hs-gesundheit.de

Diese E-Mail sowie eventuelle Anhänge können vertrauliche und / oder rechtlich 
geschützte Informationen enthalten. Wenn Sie nicht der Adressat sind oder diese 
E-Mail irrtümlich erhalten haben, informieren Sie bitte sofort den Absender und 
vernichten Sie diese Mail. Das unerlaubte Kopieren oder Speichern sowie die 
unbefugte Weitergabe dieser E-Mail sind nicht gestattet.

This e-mail and any attachments may contain confidential and / or privileged 
information. If you are not the intended recipient or have received this e-mail 
in error, please notify the sender immediately and destroy this e-mail. Any 
unauthorized copying, storing, disclosure or distribution of the contents of 
this e-mail is strictly forbidden.




-----Ursprüngliche Nachricht-----
Von: inetbib-bounces@xxxxxxxxxxxxxxxxxx 
[mailto:inetbib-bounces@xxxxxxxxxxxxxxxxxx] Im Auftrag von Heidrun Wiesenmüller
Gesendet: Montag, 3. September 2012 10:16
An: Internet in Bibliotheken
Betreff: Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)

Liebe Frau Payer, liebe Kolleginnen und Kollegen,

mir geht es in der Tat nicht darum, eine theoretische Abhandlung über RDA zu 
schreiben, sondern eine ganz praktische Einführung zum Katalogisieren mit RDA - 
sozusagen ein Pendant zum Haller/Popst (wenn auch deutlich anders aufgezogen). 
Entsprechend geht es in erster Linie um die Erläuterung wichtiger RDA-Regeln 
anhand konkreter Beispiele. Es wird natürlich auch allgemeinere Kapitel geben, 
und da kommt dann auch mal das Semantic Web vor.

Die Formatfreiheit von RDA ist ein wichtiger Punkt: RDA definiert Elemente und 
deren Inhalte, gibt aber kein Erfassungsformat vor. 
Entsprechend wird auch das Lehrbuch in seinem Hauptteil "formatfrei" 
sein; beispielhafte Umsetzungen in konkrete Erfassungsformate sind dann eher 
was für einen Anhang.

Insgesamt darf man sich den Umstieg auf RDA m.E. nicht als "revolutionär" 
vorstellen: Zumindest in der ersten Umsetzung werden für RDA dieselben Formate 
verwendet werden wie bisher. D.h. die angloamerikanische Welt wird weiter in 
MARC 21 katalogisieren (trotz der bekannten Schwierigkeiten) und wir 
entsprechend mit vorhandenen Internformaten wie z.B. Pica. Sicher werden bei 
uns ein paar neue Felder, Codes etc. eingeführt werden, aber die Datensätze 
werden trotzdem recht ähnlich aussehen wie bisher. Denn es gilt ja auch die 
Vorgabe, dass RDA in Deutschland im Szenario 2 implementiert wird, d.h. 
die Ebenen Werk, Expression und Manifestation werden nicht auseinander gezogen, 
sondern liegen weiterhin in "vermischten" Titeldatensätzen vor.

Längerfristig kann sich daran natürlich schon manches ändern. So bin ich 
gespannt, was bei der Bibframe-Initiative herauskommen wird. Es wurde ja vor 
einiger Zeit verkündet, dass die Firma Zepheira damit beauftragt wurde, "to 
translate the MARC 21 format to a Linked Data (LD) model while retaining as 
much as possible the robust and beneficial aspects of the historical format".
http://www.loc.gov/marc/transition/news/modeling-052212.html
Erste Strategien sind offenbar im Juni auf der ALA Conference präsentiert 
worden:
http://zepheira.com/2012/06/zepheira-to-present-on-linked-data-marc21-modeling-at-ala-annual/
Leider habe ich nichts darüber herausfinden können, was Eric Miller bei dieser 
Gelegenheit verkündet hat (hat vielleicht jemand einen einschlägigen Link?).

Ich halte es für gut möglich, dass irgendwann einmal die _primäre_ Form von 
Katalogdaten wirklich nicht mehr Datensätze sind, wie wir sie heute kennen, 
sondern einzelne Aussage-Tripel. Bei der Erfassung wird man allerdings, nehme 
ich an, weiterhin immer eine größere Zahl solcher Aussagen gleichzeitig 
erfassen. Denn wenn man ein konkretes Medium katalogisiert, hat man 
zwangsläufig ein ganzes Bündel von Aussagen vor sich, die man sinnvollerweise 
gleichzeitig festhält (sofern sie nicht schon von anderswoher geliefert 
werden). Beim Recherchierenden kommt dann aber wahrscheinlich nicht mehr ein 
vorher genau festgelegtes Paket von Informationen an, sondern je nach 
Fragestellung nur bestimmte Aussagen, die u.U. auch aus mehreren Quellen 
stammen. So reime ich mir das zumindest zusammen...

Mir vorzustellen, mit welchen Werkzeugen dann gearbeitet werden könnte, fällt 
mir noch sehr schwer. Braucht man weiterhin Datenbanken (aber eben eine andere 
Form davon - wenn ich's recht verstehe, ist auch ein Triplestore eine 
Datenbank), oder kann man die Daten irgendwie noch unmittelbarer im Semantic 
Web erfassen und halten? Zumindest stelle ich mir vor, dass die verteilten 
Daten (wo auch immer sie dann tatsächlich physisch liegen) in anderer Weise 
miteinander interagieren, so dass man nicht mehr sagen kann: "Ich suche jetzt 
im Datenpool X und nachher probiere ich es noch im Datenpool Y".

Viele Grüße
Heidrun Wiesenmüller

P.S.: Ja, ich weiß, ich hatte gesagt, dass ich nix mehr sage und jetzt habe 
ich's doch gemacht. Aber man beachte, dass "XML" in diesem Beitrag nicht vorkam 
;-)




Am 02.09.2012 17:24, schrieb Margarete Payer:
Lieber Herr Umstätter,

wenn Frau Wiesenmüller Ihrem Wunsch nachkäme, müsste sie ein Lehrbuch 
zu den Möglichkeiten des Semantic Web schreiben. Die RDA will ja ein 
Regelwerk sein, das in jeglicher neuen Datenbanktechnologie angewendet 
werden kann.

Einen Hinweis, dass das heutige MARC-Format die RDA nicht voll 
abbilden kann, wird sich wohl nicht umgehen lassen.

Schöne Grüße
Margarete Payer

Liebe Frau Wiesenmüller,

es gibt verschiedene Gründe sich hier nicht mehr äußern zu wollen (bzw.
können)
und so respektiere ich die ihren.

Für das RDA-Lehrbuch kann man ja nur viel Erfolg wünschen!

Da wir im Prinzip schon bei dem Thema waren, würde ich, wie Sie sich 
denken können, RDA nicht ohne Blick auf XML behandeln.

Daher hier nur die Anregung:
http://tsig.wikispaces.com/file/view/Future+of+cataloguing+for+wiki.p
pt “Future of Cataloguing: how RDA positions us for the future”
“RDA = content standard can be used with web-friendly encoding 
schema, based on XML."

bzw.

http://unllib.unl.edu/LPP/PNLA%20Quarterly/moehrle76-4.pdf
“Sally McCallum of the Library of Congress defined 9 format 
characteristics of MARC in her lecture titled "MARC Forward": "XML; 
Granularity; Versatility; Extensibility; Hierarchy support; 
Crosswalks; Tools; Cooperative management; Pervasive" (2007, p. 3). 
It's clear any replacement for MARC 21 will need these characteristics, and 
more.”


Dazu auch die Einschätzung der Bibliotheksberaterin Karen Coyle.
“There is sometimes the assumption that the future data carrier for 
library data will be XML. I think this assumption may be misleading 
and I'm going to attempt to clarify how XML may fit into the library 
data future.”
http://kcoyle.blogspot.de/2011/09/xml-and-library-data-future.html

bzw. "RDA in XML - why not give it a shot?"
http://kcoyle.blogspot.de/2011/07/rda-in-xml-why-not-give-it-shot.htm
l

Es wird also bezüglich XML auf drei Probleme ankommen:
1.   Mit welcher DTD kann man RDA am besten ausschöpfen (Verhältnis zu
JATS NISO Z39.96-2012
http://www.niso.org/apps/group_public/download.php/8975/z39.96-2012.p
df
)?
2.   Wie leistungsfähig werden XML-Native-Datenbanken (oder auch Google)
diese DTD recherchieren können,
wenn wir in diesem Bereich endlich die Ebene der relationalen 
Datenbanken überwunden haben.
3. Wird es noch vor dieser XML-Nutzung eine Abzweigung der 
Entwicklung z.B zu Turtle (Terse RDF Triple Language) geben.

Dass es verschiedene Philosophien in der Wissensverarbeitung und den 
Ontologien (für die ja die Semantik Voraussetzung ist) gibt, ist 
bekannt.
Als dokumentarisch denkender Mensch, war mir das Konzept der 
Dokumente mit Frames und Slots immer näher als die Triple languages, 
da sich mit struktirierten Dokumenten ein Objekt beschreiben lässt 
(aus archivarischen und historischen Gründen am besten in reiner ASCII bzw.
UNICODE-Form, wie bei SGML), bei dem dann Interferenzmaschinen sich 
in einer Art Datamining das an Information herausfiltern können, was 
sie für ihre Entscheidungen brauchen. Also beispielsweise welche 
Rechte ein Fragesteller bei einem Dokument hat, was er sehen oder 
hören darf, was er dafür zahlen muss oder wie weit er es weiter 
verwenden darf, um nur ein Beispiel zu nennen.

"In etlichen Bibliotheken gibt es dazu Dateien, beispielsweise mit 
Ampelanzeigen, die mit rot (ohne Bibliothekszugang), gelb (einige 
Aufsätze zugänglich) und grün (Bibliothekszugang) den Zugang für 
jeden Benutzer signalisieren. Dahinter stehen Dateien, auch Knowledge 
Bases genannt, die jeweils prüfen, welche Zugriffsrechte das 
jeweilige Terminal zur Zeit hat. Da diese Rechte immer wieder 
verändert sein können und über unterschiedliche Kanäle erworben 
werden (so verkaufen große Verlage ihre Zugriffsrechte auf 
Publikationen gern im Paket), sind die Ampelangaben nicht immer 
korrekt, da die Benutzer über verschiedene Verträge der Bibliothek 
unterschiedliche Zugangsberechtigungen beim Linkresolver SFX 
bekommen. Damit ist der Zugang bzw. die Zugangsprozedur von 
verschieden Terminals nicht immer identisch. Im Prinzip vergleicht 
SFX die Zugangsrechte bei einer URL mit den Lizenzrechten der 
Bibliothek und deren Benutzerkennungen." (Lehrb. 
Bibliotheksmanagement S. 81) Schon heute hat jede Bibliothek das 
Problem herauszufinden, welche Rechte ihre Benutzer welchen digitalen 
Dokumenten gegenüber haben. Dabei geht es um viel Geld.

Die Bevorzugung von Tripeln in Ontologien ist ähnlich der bei 
relationalen Datenbanken. Sie sind einfacher und bekannter, aber 
damit nicht unbedingt besser als Frames und Slots. Das gilt 
insbesondere für den Bibliotheksbereich.

Frames und Slots hat die NLM schon beim Unified Medical Language 
System
(UMLS) benutzt. (
http://pubmedcentralcanada.ca/pmcc/articles/PMC2245463/pdf/procascamc
00016-0196.pdf ), obwohl damals H. Warner noch kein XML zur Verfügung 
stand.


Mit freundlichen Grüßen

Walther Umstätter




--
---------------------
Prof. Heidrun Wiesenmüller M.A.
Hochschule der Medien
Fakultät Information und Kommunikation
Wolframstr. 32, 70191 Stuttgart
Tel. dienstl.: 0711/25706-188
Tel. Home Office: 0711/36565868
Fax. 0711/25706-300
www.hdm-stuttgart.de/bi

--
http://www.inetbib.de
-- 
http://www.inetbib.de

Listeninformationen unter http://www.inetbib.de.