[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)
- Date: Thu, 30 Aug 2012 22:10:40 +0200
- From: h0228kdm <h0228kdm@xxxxxxxxxxxxxxxx>
- Subject: Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)
Am 30.08.2012 20:25, schrieb Heidrun Wiesenmüller:
Lieber Herr Umstätter,
Am 30.08.2012 11:04, schrieb h0228kdm:
So kam mir beim Verriss H. Wiesenmüllers der „Einführung in die
Katalogkunde“ der schöne Satz: „Die Bedeutung von XML schließlich,
das
an vielen Stellen innerhalb des Bandes auftaucht, wird von den
Autoren
stark überschätzt.“
(http://www.b-u-b.de/pdfarchiv/Heft-BuB_01_2006.pdf
) in Erinnerung, und das mitten in der Entwicklung des Semantic Web
und
der Tatsache, dass FRBR, DDC etc. auf dieser XML Entwicklung
aufbauen.
In der Tat teile ich Ihre Einschätzung zu XML nicht. Ich hatte in der
damaligen Rezension geschrieben: "Die Bedeutung von XML schließlich,
das
an vielen Stellen innerhalb des Bandes auftaucht, wird von den
Autoren
stark überschätzt. Dieser Standard nämlich kann vorhandene
bibliothekarische Formate nicht ersetzen, sondern ist nur eine neue -
freilich sehr nützliche - Methode, um diese zu 'verpacken' (vor allem
für den Datenaustausch, etwa über OAI). Auf die zugrunde liegenden
Katalogisierungsregeln hat XML keinen unmittelbaren Einfluss."
Ich bezog mich dabei auf Passagen in Ihrem Buch wie diese:
"Sollte man nun den Schritt zu einer international verwendeten
Verbundkatalogisierung tun, um dann gemeinsam mit all den anderen
teilnehmenden Bibliotheken die bereits vorhandenen bibliothekarischen
DTDs im Rahmen von XML nutzen, oder wäre es günstiger, in Deutschland
ein eigenes moderneres Katalogisierungsformat anzustreben, das heute
allerdings sicher auch auf der Basis von XML erzeugt werden muss."
(S. 45)
"Mit Hilfe von Adaptionen werden die Übergänge von MARC zu XML und
von
AACR zu den Metadaten zur Zeit vorgenommen." (S. 46)
"Dabei wurde auch bereits von dem Ersatz von MARC durch ein
entsprechendes XML-Format gesprochen. Hier handelt es sich um
Software
zur Konversion von MARC-Daten zu XML." (S. 56)
An MARC XML kann man gut sehen, was ich mit "Verpackung" gemeint
habe.
Hier ein Beispiel aus der offiziellen Dokumentation
(http://www.loc.gov/standards/marcxml/Sandburg/sandburg.xml). Man
vergleiche die MARC-Kategorie 100 (Haupteintragung unter einer
Person):
normales MARC 21:
100 1_ $a Sandburg, Carl, $d 1878-1967.
(Erläuterung für Nicht-MARC-Kundige: der erste Indikator steht auf
"1",
d.h. es handelt sich um einen normalen Namen der Form "Nachname,
Vorname". Der eigentliche Name kommt ins Unterfeld $a, die
Lebensdaten
in Unterfeld $b).
Und nun dasselbe in MARC XML:
<datafield tag="100" ind1="1" ind2="">
<subfield code="a">Sandburg, Carl,</subfield>
<subfield code="b">1878-1967.</subfield>
</datafield>
Alles, was hieran _semantisch_ ist (Definition der Datenelemente,
Bedeutung der Indikatoren), stammt nicht aus XML, sondern aus MARC.
Diese Informationen sind nun aber - jetzt kommt XML ins Spiel - in
syntaktisch anderer Weise aufbereitet. XML bewegt sich also nach
meinem
Verständnis auf einer ganz anderen Ebene als bibliothekarische
Datenformate wie MARC 21, als Metadatenstandards wie Dublin Core oder
als RDA (das den Anspruch hat, ein gänzlich formatfreier "content
standard" zu sein). Es ist keine Frage, dass man alles mögliche mit
XML
verpacken kann (sofern es irgendwie strukturiert ist) - aber das
heißt
doch nicht, dass XML dann dieses andere ersetzt.
XML ist weniger ein Verpackungssystem, sondern als eine Auszeichnungs-
bzw. Metasprache in der Lage Worten, Texten bzw. Zeichen Bedeutungen
zuzuordnen, womit es vor über Zehn Jahren zur Basis des Semantic Webs
wurde. Wenn man dann noch ein kontrolliertes Vokabular wie die DDC
nutzen kann, erleichtert das die Interpretation von Begriffen für die
Computer erheblich, weil sie damit auch Ober- und Unterbegriffe haben.
Für den Austausch von Daten hat XML gewiss erhebliche Bedeutung - es
ist
ja nicht zufällig auch in der Industrie ein weit verbreiteter
Standard.
Es gibt m.W. auch XML-Datenbanken, die Daten nicht nur als XML
ausgeben
und einlesen können, sondern sie auch intern als XML-Dokumente
vorhalten
(z.B. BaseX). Solche Datenbanken haben manche Vorteile, sind aber
wohl
bei größeren Datenmengen nicht so performant wie relationale
Datenbanken. Deshalb sehe ich im Moment nicht, dass sich XML als
internes Datenbankformat auf breiter Front durchsetzen würde.
Ich sehe nur, wo es sich schon durchgesetzt hat (LoC, OCLC, NLM ...).
Sie bringen XML aber nun auch sehr stark mit dem Semantic Web in
Verbindung, was ich nicht ganz nachvollziehen kann.
Wenn Sie das aus meinen Publikationen dazu nicht nachvollziehen können,
hilft Ihnen möglicherweise das:
www.enzyklopaedie-der-wirtschaftsinformatik.de/wi-enzyklopaedie/lexikon/technologien-methoden/Rechnernetz/Semantic-Web
Bezogen auf bibliothekarische Formalkatalogisierung bedeutet dies, dass
die Bibliothekare (ohne es oft zu merken) alles dazu vorbereiten um die
intelligenten Software-Agenten die Copyrights im Internet überwachen zu
lassen. Dagegen ist grundsätzlich nichts einzuwenden. Ich versuche nur
seit Jahren darauf aufmerksam zu machen, bevor dann etliche
Katalogisierer plötzlich aus allen Wolken fallen, zumal ja nicht alle
mit den heutigen Urheber- und Leistungsschutzrechten einverstanden sind.
Hier lesen gewiss
Leute mit, die deutlich mehr vom Semantic Web verstehen als ich und
mich
bei Bedarf korrigieren können: Nach meinem Kenntnisstand ist XML
_nicht_
die entscheidende Technologie im Semantic Web - und zwar deshalb,
weil
XML eben nur die Syntax betrifft und nicht die Semantik.
Siehe oben. H. Stuckenschmidt - Semantic Web: " Dies soll dadurch
erreicht werden, dass die intendierte Bedeutung von Informationen auf
entsprechenden Webseiten mit Hilfe spezialisierter XML-basierter
Auszeichnungssprachen in maschinenlesbarer Form zur Verfügung gestellt
werden."
Es hat deshalb
für das Semantic Web nicht dieselbe Bedeutung wie etwa RDF oder OWL.
Ich
zitiere die englische Wikipedia: "XML provides an elemental syntax
for
content structure within documents, yet associates no semantics with
the
meaning of the content contained within. XML is not at present a
necessary component of Semantic Web technologies in most cases, as
alternative syntaxes exists, such as Turtle."
(http://en.wikipedia.org/wiki/Semantic_Web)
"not at present a necessary component" heißt hier nur, dass man auch
XML weiterentwickel bzw. durch Turtle als RDF/XML Surrogat einsetzen
kann.
Gänzlich neu wäre mir, dass - was Sie als "Tatsache" bezeichnen -
"FRBR,
DDC etc. auf dieser XML Entwicklung aufbauen". FRBR ist ein
Entity-relationship model. Die ERM-Methodik (Definition von Entitäten
mit bestimmten Merkmalen, sowie den Beziehungen zwischen den
Entitäten)
stammt aus dem Design relationaler Datenbanken und wurde, soweit ich
weiß, in den 1970-er Jahren entwickelt. "XML" kommt im ganzen
FRBR-Bericht nirgends vor.
Außerdem wurde vor einigen Jahren eine objektorientierte Variante von
FRBR als formale Ontologie entwickelt (FBRRoo):
http://www.cidoc-crm.org/frbr_drafts.html
Auch dieses bewegt sich auf einer ganz anderen Ebene als der rein
syntaktischen, und XML wird nicht erwähnt.
Darum weise ich ja auf den Zusammenhang hin, weil es nicht überall
explizit deutlich gemacht wird.
Ich rätsele auch, wo Sie den Bezug zwischen der DDC und XML sehen.
Natürlich kann man die DDC - wie andere Klassifikationen oder
Thesauri
auch - mit der Datenbeschreibungssprache SKOS ausdrücken und damit
für
das Semantic Web aufbereiten. SKOS wiederum baut auf RDF auf. Und für
RDF-Tripel braucht man wieder irgendeine Syntax wie RDF-XML oder
Turtle.
Aber daraus folgt doch nicht, dass die DDC auf XML aufbaut...
Siehe oben.
Tja, und damit bin ich nun mit meinen Exegese-Künsten am Ende.
Als Lehrbuchautor hat man ja noch immer die Hoffnung, dass im Laufe der
Zeit wenigsten einige Leser daraus Gewinn ziehen ;-)
Viele Grüße
Heidrun Wiesenmüller
MfG
Walther Umstätter
--
http://www.inetbib.de
Listeninformationen unter http://www.inetbib.de.