[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)



Am 30.08.2012 20:25, schrieb Heidrun Wiesenmüller:
Lieber Herr Umstätter,


Am 30.08.2012 11:04, schrieb h0228kdm:
So kam mir beim Verriss H. Wiesenmüllers der „Einführung in die
Katalogkunde“ der schöne Satz: „Die Bedeutung von XML schließlich, 
das
an vielen Stellen innerhalb des Bandes auftaucht, wird von den 
Autoren
stark überschätzt.“ 
(http://www.b-u-b.de/pdfarchiv/Heft-BuB_01_2006.pdf
) in Erinnerung, und das mitten in der Entwicklung des Semantic Web 
und
der Tatsache, dass FRBR, DDC etc. auf dieser XML Entwicklung 
aufbauen.

In der Tat teile ich Ihre Einschätzung zu XML nicht. Ich hatte in der
damaligen Rezension geschrieben: "Die Bedeutung von XML schließlich, 
das
an vielen Stellen innerhalb des Bandes auftaucht, wird von den 
Autoren
stark überschätzt. Dieser Standard nämlich kann vorhandene
bibliothekarische Formate nicht ersetzen, sondern ist nur eine neue -
freilich sehr nützliche - Methode, um diese zu 'verpacken' (vor allem
für den Datenaustausch, etwa über OAI). Auf die zugrunde liegenden
Katalogisierungsregeln hat XML keinen unmittelbaren Einfluss."

Ich bezog mich dabei auf Passagen in Ihrem Buch wie diese:
"Sollte man nun den Schritt zu einer international verwendeten
Verbundkatalogisierung tun, um dann gemeinsam mit all den anderen
teilnehmenden Bibliotheken die bereits vorhandenen bibliothekarischen
DTDs im Rahmen von XML nutzen, oder wäre es günstiger, in Deutschland
ein eigenes moderneres Katalogisierungsformat anzustreben, das heute
allerdings sicher auch auf der Basis von XML erzeugt werden muss." 
(S. 45)
"Mit Hilfe von Adaptionen werden die Übergänge von MARC zu XML und 
von
AACR zu den Metadaten zur Zeit vorgenommen." (S. 46)
"Dabei wurde auch bereits von dem Ersatz von MARC durch ein
entsprechendes XML-Format gesprochen. Hier handelt es sich um 
Software
zur Konversion von MARC-Daten zu XML." (S. 56)

An MARC XML kann man gut sehen, was ich mit "Verpackung" gemeint 
habe.
Hier ein Beispiel aus der offiziellen Dokumentation
(http://www.loc.gov/standards/marcxml/Sandburg/sandburg.xml). Man
vergleiche die MARC-Kategorie 100 (Haupteintragung unter einer 
Person):

normales MARC 21:
100 1_ $a Sandburg, Carl, $d 1878-1967.

(Erläuterung für Nicht-MARC-Kundige: der erste Indikator steht auf 
"1",
d.h. es handelt sich um einen normalen Namen der Form "Nachname,
Vorname". Der eigentliche Name kommt ins Unterfeld $a, die 
Lebensdaten
in Unterfeld $b).

Und nun dasselbe in MARC XML:
<datafield tag="100" ind1="1" ind2="">
     <subfield code="a">Sandburg, Carl,</subfield>
     <subfield code="b">1878-1967.</subfield>
</datafield>

Alles, was hieran _semantisch_ ist (Definition der Datenelemente,
Bedeutung der Indikatoren), stammt nicht aus XML, sondern aus MARC.
Diese Informationen sind nun aber - jetzt kommt XML ins Spiel - in
syntaktisch anderer Weise aufbereitet. XML bewegt sich also nach 
meinem
Verständnis auf einer ganz anderen Ebene als bibliothekarische
Datenformate wie MARC 21, als Metadatenstandards wie Dublin Core oder
als RDA (das den Anspruch hat, ein gänzlich formatfreier "content
standard" zu sein). Es ist keine Frage, dass man alles mögliche mit 
XML
verpacken kann (sofern es irgendwie strukturiert ist) - aber das 
heißt
doch nicht, dass XML dann dieses andere ersetzt.

XML ist weniger ein Verpackungssystem, sondern als eine Auszeichnungs- 
bzw. Metasprache in der Lage Worten, Texten bzw. Zeichen Bedeutungen 
zuzuordnen, womit es vor über Zehn Jahren zur Basis des Semantic Webs 
wurde. Wenn man dann noch ein kontrolliertes Vokabular wie die DDC 
nutzen kann, erleichtert das die Interpretation von Begriffen für die 
Computer erheblich, weil sie damit auch Ober- und Unterbegriffe haben.

Für den Austausch von Daten hat XML gewiss erhebliche Bedeutung - es 
ist
ja nicht zufällig auch in der Industrie ein weit verbreiteter 
Standard.
Es gibt m.W. auch XML-Datenbanken, die Daten nicht nur als XML 
ausgeben
und einlesen können, sondern sie auch intern als XML-Dokumente 
vorhalten
(z.B. BaseX). Solche Datenbanken haben manche Vorteile, sind aber 
wohl
bei größeren Datenmengen nicht so performant wie relationale
Datenbanken. Deshalb sehe ich im Moment nicht, dass sich XML als
internes Datenbankformat auf breiter Front durchsetzen würde.

Ich sehe nur, wo es sich schon durchgesetzt hat (LoC, OCLC, NLM ...).

Sie bringen XML aber nun auch sehr stark mit dem Semantic Web in
Verbindung, was ich nicht ganz nachvollziehen kann.

Wenn Sie das aus meinen Publikationen dazu nicht nachvollziehen können, 
hilft Ihnen möglicherweise das:
www.enzyklopaedie-der-wirtschaftsinformatik.de/wi-enzyklopaedie/lexikon/technologien-methoden/Rechnernetz/Semantic-Web
Bezogen auf bibliothekarische Formalkatalogisierung bedeutet dies, dass 
die Bibliothekare (ohne es oft zu merken) alles dazu vorbereiten um die 
intelligenten Software-Agenten die Copyrights im Internet überwachen zu 
lassen. Dagegen ist grundsätzlich nichts einzuwenden. Ich versuche nur 
seit Jahren darauf aufmerksam zu machen, bevor dann etliche 
Katalogisierer plötzlich aus allen Wolken fallen, zumal ja nicht alle 
mit den heutigen Urheber- und Leistungsschutzrechten einverstanden sind.

Hier lesen gewiss
Leute mit, die deutlich mehr vom Semantic Web verstehen als ich und 
mich
bei Bedarf korrigieren können: Nach meinem Kenntnisstand ist XML 
_nicht_
die entscheidende Technologie im Semantic Web - und zwar deshalb, 
weil
XML eben nur die Syntax betrifft und nicht die Semantik.

Siehe oben. H. Stuckenschmidt - Semantic Web: " Dies soll dadurch 
erreicht werden, dass die intendierte Bedeutung von Informationen auf 
entsprechenden Webseiten mit Hilfe spezialisierter XML-basierter 
Auszeichnungssprachen in maschinenlesbarer Form zur Verfügung gestellt 
werden."

Es hat deshalb
für das Semantic Web nicht dieselbe Bedeutung wie etwa RDF oder OWL. 
Ich
zitiere die englische Wikipedia: "XML provides an elemental syntax 
for
content structure within documents, yet associates no semantics with 
the
meaning of the content contained within. XML is not at present a
necessary component of Semantic Web technologies in most cases, as
alternative syntaxes exists, such as Turtle."
(http://en.wikipedia.org/wiki/Semantic_Web)

"not at present a necessary component" heißt hier nur, dass man auch 
XML weiterentwickel bzw. durch Turtle als RDF/XML Surrogat einsetzen 
kann.

Gänzlich neu wäre mir, dass - was Sie als "Tatsache" bezeichnen - 
"FRBR,
DDC etc. auf dieser XML Entwicklung aufbauen". FRBR ist ein
Entity-relationship model. Die ERM-Methodik (Definition von Entitäten
mit bestimmten Merkmalen, sowie den Beziehungen zwischen den 
Entitäten)
stammt aus dem Design relationaler Datenbanken und wurde, soweit ich
weiß, in den 1970-er Jahren entwickelt. "XML" kommt im ganzen
FRBR-Bericht nirgends vor.

Außerdem wurde vor einigen Jahren eine objektorientierte Variante von
FRBR als formale Ontologie entwickelt (FBRRoo):
http://www.cidoc-crm.org/frbr_drafts.html
Auch dieses bewegt sich auf einer ganz anderen Ebene als der rein
syntaktischen, und XML wird nicht erwähnt.

Darum weise ich ja auf den Zusammenhang hin, weil es nicht überall 
explizit deutlich gemacht wird.

Ich rätsele auch, wo Sie den Bezug zwischen der DDC und XML sehen.
Natürlich kann man die DDC - wie andere Klassifikationen oder 
Thesauri
auch - mit der Datenbeschreibungssprache SKOS ausdrücken und damit 
für
das Semantic Web aufbereiten. SKOS wiederum baut auf RDF auf. Und für
RDF-Tripel braucht man wieder irgendeine Syntax wie RDF-XML oder 
Turtle.
Aber daraus folgt doch nicht, dass die DDC auf XML aufbaut...

Siehe oben.

Tja, und damit bin ich nun mit meinen Exegese-Künsten am Ende.

Als Lehrbuchautor hat man ja noch immer die Hoffnung, dass im Laufe der 
Zeit wenigsten einige Leser daraus Gewinn ziehen ;-)

Viele Grüße
Heidrun Wiesenmüller

MfG

Walther Umstätter

-- 
http://www.inetbib.de

Listeninformationen unter http://www.inetbib.de.