[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)



Lieber Herr Umstätter,

XML ist weniger ein Verpackungssystem, sondern als eine Auszeichnungs- 
bzw. Metasprache in der Lage Worten, Texten bzw. Zeichen Bedeutungen 
zuzuordnen, womit es vor über Zehn Jahren zur Basis des Semantic Webs 
wurde.

"Verpackung" war natürlich im übertragenen Sinne gemeint.

Mit dem "Zuordnen von Bedeutungen" in Ihrer Definition habe ich 
Schwierigkeiten. M.E. liegt hier ein Missverständnis vor: Nicht XML 
schafft die Bedeutung, sondern die Ontologie, welche durch eine logische 
Sprache wie RDF repräsentiert wird.

Im O'Reilly-Blog gibt's einen lustigen Post dazu, der aber den 
Unterschied ganz gut trifft:
http://www.oreillynet.com/xml/blog/2005/09/the_difference_between_xml_and.html
Zitat: "XML is basically just a data format. A pretty good one, but 
there is no built-in meaning to an XML file; unless your computer has 
prior knowledge of a particular type of XML (a particular schema, like 
XHTML or SVG), it won’t be able to do much with it. (...) With RDF, it’s 
a different kettle of fish. (...) RDF isn’t a data format, it’s… a model".

Interessant ist vielleicht auch ein einschlägiger Beitrag von Tim 
Berners-Lee:
http://www.w3.org/DesignIssues/RDF-XML.html
Zu XML sagt er u.a.: "Without looking at the schema, you know things 
about the document structure, but nothing else. You can't tell what to 
deduce."

Siehe oben. H. Stuckenschmidt - Semantic Web: " Dies soll dadurch
erreicht werden, dass die intendierte Bedeutung von Informationen auf
entsprechenden Webseiten mit Hilfe spezialisierter XML-basierter
Auszeichnungssprachen in maschinenlesbarer Form zur Verfügung gestellt
werden."

Ich sehe hier keinen Widerspruch zu meinen Aussagen: XML ist ein 
Werkzeug für die _Präsentation_ der Bedeutung - aber auch nicht mehr als 
das. Liest man den ganzen Text des Kollegen Stuckenschmidt, so wird 
deutlich, dass XML sozusagen nur die Oberflächen-Schicht ist. Das 
Entscheidende passiert darunter, auf der Ebene der Ontologie: "Das 
entsprechende Vokabular (...) wird hierbei durch ein allgemein 
zugängliches Model (...) zur Verfügung gestellt welches sowohl vom 
Anbieter als auch vom Agenten verwendet wird. Dieses Vokabular (...) 
wird auch als Ontologie bezeichnet". Ganz klar ist der Unterschied 
zwischen Syntax (XML) und Vokabular. Natürlich braucht das Gesamt-System 
auch eine Syntax, damit es funktioniert - aber das macht die Syntax 
nicht zum Kern des Systems. Deshalb ist XML zwar durchaus ein Baustein 
im Semantic Web, aber nicht die "Basis des Semantic Web" (zumal es auch 
durch andere Arten von Syntax wie N3 oder Turtle ersetzt werden kann).

Sehr häufig sieht man ja auch Darstellungen der Gesamtarchitektur des 
Semantic Web (die auf eine Folie von Berners-Lee zurückgehen), wie z.B. 
hier:
http://www.obitko.com/tutorials/ontologies-semantic-web/semantic-web-architecture.html
Auch da kommt XML natürlich vor, und zwar als "a common syntax used in 
the semantic web." Um die Semantik geht's in anderen Schichten.


Für den Austausch von Daten hat XML gewiss erhebliche Bedeutung - es
ist
ja nicht zufällig auch in der Industrie ein weit verbreiteter
Standard.
Es gibt m.W. auch XML-Datenbanken, die Daten nicht nur als XML
ausgeben
und einlesen können, sondern sie auch intern als XML-Dokumente
vorhalten
(z.B. BaseX). Solche Datenbanken haben manche Vorteile, sind aber
wohl
bei größeren Datenmengen nicht so performant wie relationale
Datenbanken. Deshalb sehe ich im Moment nicht, dass sich XML als
internes Datenbankformat auf breiter Front durchsetzen würde.
Ich sehe nur, wo es sich schon durchgesetzt hat (LoC, OCLC, NLM ...).

Was meinen Sie mit "durchgesetzt"? Wenn Sie damit ausdrücken wollen, 
dass OCLC und andere XML als Syntax z.B. für Web Services verwenden, 
dann stimme ich Ihnen natürlich zu. Die WorldCat Search API z.B. gibt 
MARC XML aus, und auch der xISSN-Dienst verwendet XML. Das entspricht 
auch ganz meiner Aussage, dass XML für den Austausch von Daten von 
erheblicher Bedeutung ist.

Oder meinen Sie damit, dass z.B. der WorldCat auf einer XML-Datenbank 
basiert? Wenn das so ist, habe ich in der Tat etwas verpasst.



Es hat deshalb für das Semantic Web nicht dieselbe Bedeutung wie etwa RDF 
oder OWL.
Ich zitiere die englische Wikipedia: "XML provides an elemental syntax
for content structure within documents, yet associates no semantics with
the meaning of the content contained within. XML is not at present a
necessary component of Semantic Web technologies in most cases, as
alternative syntaxes exists, such as Turtle."
(http://en.wikipedia.org/wiki/Semantic_Web)
"not at present a necessary component" heißt hier nur, dass man auch
XML weiterentwickel bzw. durch Turtle als RDF/XML Surrogat einsetzen
kann.

Bei den technischen Details kenne ich mich leider gar nicht aus - 
vielleicht kann jemand anderes dazu etwas beisteuern (falls außer Herrn 
Umstätter und mir überhaupt noch jemand diesen Thread verfolgt)? Es ist 
aber offenbar so, dass Turtle nicht auf XML basiert: "Turtle is 
extremely concise, extremely human-readable, and extremely 
machine-readable. The only disadvantage is that it isn't XML."
http://djpowell.net/schemas/treetriples/1/SyntaxComparison.html

Mit RDF/XML scheint es übrigens nicht wenige Probleme zu geben, vgl. 
diesen Blog-Post:
http://milicicvuk.com/blog/2011/07/21/problems-of-the-rdf-syntax/
Zitat: "It is believed that RDF/XML has significantly slowed the 
adoption of RDF and the Semantic Web idea."
Hm, ist XML womöglich also nicht die Basis des Semantic Web, sondern 
eher ein Stolperstein dafür?



Gänzlich neu wäre mir, dass - was Sie als "Tatsache" bezeichnen -
"FRBR, DDC etc. auf dieser XML Entwicklung aufbauen". FRBR ist ein
Entity-relationship model. Die ERM-Methodik (Definition von Entitäten
mit bestimmten Merkmalen, sowie den Beziehungen zwischen den
Entitäten) stammt aus dem Design relationaler Datenbanken und wurde, soweit 
ich
weiß, in den 1970-er Jahren entwickelt. "XML" kommt im ganzen
FRBR-Bericht nirgends vor.

Außerdem wurde vor einigen Jahren eine objektorientierte Variante von
FRBR als formale Ontologie entwickelt (FBRRoo):
http://www.cidoc-crm.org/frbr_drafts.html
Auch dieses bewegt sich auf einer ganz anderen Ebene als der rein
syntaktischen, und XML wird nicht erwähnt.
Darum weise ich ja auf den Zusammenhang hin, weil es nicht überall
explizit deutlich gemacht wird.

Aber was für ein Zusammenhang soll das denn nun sein?

Gewiss gibt es seit einigen Jahren auch für FRBR eine Umsetzung in RDF/XML:
http://metadataregistry.org/schema/show/id/5.html
(vgl. dazu auch 
http://www.ifla.org/files/cataloguing/frbrrg/namespace-report.pdf)
Ergibt sich daraus, dass FRBR auf XML aufbaut???

Auch gehen natürlich viele FRBRisierungs-Projekte mit Daten in 
XML-Syntax um. Z.B. wurden in einem Projekt der Indiana University XML 
Schema Definitions für FRBR entwickelt; man kann dort auch FRBRisierte 
Daten in XML herunterladen: http://www.dlib.indiana.edu/projects/vfrbr/
Aber auch hier ist doch nicht XML der Bedeutungsträger, sondern das auf 
FRBR beruhende Datenmodell.

Auch in der umfangreichen Literatur zu FRBR (von der ich gewiss nicht 
alles, aber doch recht viel gelesen habe) bin ich nach meiner Erinnerung 
nie auf die Aussage gestoßen, dass FRBR auf XML aufbauen würde. 
Vielleicht könnten Sie meiner Erinnerung auf die Sprünge helfen und mir 
einen einschlägigen Beleg aus der Literatur liefern?

Bei dieser Diskussion kam mir übrigens die Rezension eines anderen 
Umstätter-Werkes in den Sinn - ausnahmsweise nicht von mir, sondern von 
Joachim Eberhardt:
http://www.llb-detmold.de/wir-ueber-uns/aus-unserer-arbeit/texte/2010-1.html
Er wunderte sich darin u.a. über die Definition von "Intelligenz" und 
kommentierte: "Es ist dem Rezensenten nicht gelungen, eine Quelle zu 
finden, die diese Definition mit Umstätter teilt, was auch dadurch 
erschwert wurde, dass er selbst keine angibt. Trotzdem genügt diese 
Definition ihm, um "unzählige Laien, aber auch Wissenschaftler" dafür zu 
tadeln, dass sie das Wort Intelligenz falsch gebrauchen (S. 53)."

Viele Grüße
Heidrun Wiesenmüller

-- 
---------------------
Prof. Heidrun Wiesenmüller M.A.
Hochschule der Medien
Fakultät Information und Kommunikation
Wolframstr. 32, 70191 Stuttgart
Tel. dienstl.: 0711/25706-188
Tel. Home Office: 0711/36565868
Fax. 0711/25706-300
www.hdm-stuttgart.de/bi

-- 
http://www.inetbib.de

Listeninformationen unter http://www.inetbib.de.