[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)
- Date: Fri, 31 Aug 2012 13:33:35 +0200
- From: Heidrun Wiesenmüller <wiesenmueller@xxxxxxxxxxxxxxxx>
- Subject: Re: [InetBib] Bedeutung von XML (war bibliojobs ... VAB)
Lieber Herr Umstätter,
XML ist weniger ein Verpackungssystem, sondern als eine Auszeichnungs-
bzw. Metasprache in der Lage Worten, Texten bzw. Zeichen Bedeutungen
zuzuordnen, womit es vor über Zehn Jahren zur Basis des Semantic Webs
wurde.
"Verpackung" war natürlich im übertragenen Sinne gemeint.
Mit dem "Zuordnen von Bedeutungen" in Ihrer Definition habe ich
Schwierigkeiten. M.E. liegt hier ein Missverständnis vor: Nicht XML
schafft die Bedeutung, sondern die Ontologie, welche durch eine logische
Sprache wie RDF repräsentiert wird.
Im O'Reilly-Blog gibt's einen lustigen Post dazu, der aber den
Unterschied ganz gut trifft:
http://www.oreillynet.com/xml/blog/2005/09/the_difference_between_xml_and.html
Zitat: "XML is basically just a data format. A pretty good one, but
there is no built-in meaning to an XML file; unless your computer has
prior knowledge of a particular type of XML (a particular schema, like
XHTML or SVG), it won’t be able to do much with it. (...) With RDF, it’s
a different kettle of fish. (...) RDF isn’t a data format, it’s… a model".
Interessant ist vielleicht auch ein einschlägiger Beitrag von Tim
Berners-Lee:
http://www.w3.org/DesignIssues/RDF-XML.html
Zu XML sagt er u.a.: "Without looking at the schema, you know things
about the document structure, but nothing else. You can't tell what to
deduce."
Siehe oben. H. Stuckenschmidt - Semantic Web: " Dies soll dadurch
erreicht werden, dass die intendierte Bedeutung von Informationen auf
entsprechenden Webseiten mit Hilfe spezialisierter XML-basierter
Auszeichnungssprachen in maschinenlesbarer Form zur Verfügung gestellt
werden."
Ich sehe hier keinen Widerspruch zu meinen Aussagen: XML ist ein
Werkzeug für die _Präsentation_ der Bedeutung - aber auch nicht mehr als
das. Liest man den ganzen Text des Kollegen Stuckenschmidt, so wird
deutlich, dass XML sozusagen nur die Oberflächen-Schicht ist. Das
Entscheidende passiert darunter, auf der Ebene der Ontologie: "Das
entsprechende Vokabular (...) wird hierbei durch ein allgemein
zugängliches Model (...) zur Verfügung gestellt welches sowohl vom
Anbieter als auch vom Agenten verwendet wird. Dieses Vokabular (...)
wird auch als Ontologie bezeichnet". Ganz klar ist der Unterschied
zwischen Syntax (XML) und Vokabular. Natürlich braucht das Gesamt-System
auch eine Syntax, damit es funktioniert - aber das macht die Syntax
nicht zum Kern des Systems. Deshalb ist XML zwar durchaus ein Baustein
im Semantic Web, aber nicht die "Basis des Semantic Web" (zumal es auch
durch andere Arten von Syntax wie N3 oder Turtle ersetzt werden kann).
Sehr häufig sieht man ja auch Darstellungen der Gesamtarchitektur des
Semantic Web (die auf eine Folie von Berners-Lee zurückgehen), wie z.B.
hier:
http://www.obitko.com/tutorials/ontologies-semantic-web/semantic-web-architecture.html
Auch da kommt XML natürlich vor, und zwar als "a common syntax used in
the semantic web." Um die Semantik geht's in anderen Schichten.
Für den Austausch von Daten hat XML gewiss erhebliche Bedeutung - es
ist
ja nicht zufällig auch in der Industrie ein weit verbreiteter
Standard.
Es gibt m.W. auch XML-Datenbanken, die Daten nicht nur als XML
ausgeben
und einlesen können, sondern sie auch intern als XML-Dokumente
vorhalten
(z.B. BaseX). Solche Datenbanken haben manche Vorteile, sind aber
wohl
bei größeren Datenmengen nicht so performant wie relationale
Datenbanken. Deshalb sehe ich im Moment nicht, dass sich XML als
internes Datenbankformat auf breiter Front durchsetzen würde.
Ich sehe nur, wo es sich schon durchgesetzt hat (LoC, OCLC, NLM ...).
Was meinen Sie mit "durchgesetzt"? Wenn Sie damit ausdrücken wollen,
dass OCLC und andere XML als Syntax z.B. für Web Services verwenden,
dann stimme ich Ihnen natürlich zu. Die WorldCat Search API z.B. gibt
MARC XML aus, und auch der xISSN-Dienst verwendet XML. Das entspricht
auch ganz meiner Aussage, dass XML für den Austausch von Daten von
erheblicher Bedeutung ist.
Oder meinen Sie damit, dass z.B. der WorldCat auf einer XML-Datenbank
basiert? Wenn das so ist, habe ich in der Tat etwas verpasst.
Es hat deshalb für das Semantic Web nicht dieselbe Bedeutung wie etwa RDF
oder OWL.
Ich zitiere die englische Wikipedia: "XML provides an elemental syntax
for content structure within documents, yet associates no semantics with
the meaning of the content contained within. XML is not at present a
necessary component of Semantic Web technologies in most cases, as
alternative syntaxes exists, such as Turtle."
(http://en.wikipedia.org/wiki/Semantic_Web)
"not at present a necessary component" heißt hier nur, dass man auch
XML weiterentwickel bzw. durch Turtle als RDF/XML Surrogat einsetzen
kann.
Bei den technischen Details kenne ich mich leider gar nicht aus -
vielleicht kann jemand anderes dazu etwas beisteuern (falls außer Herrn
Umstätter und mir überhaupt noch jemand diesen Thread verfolgt)? Es ist
aber offenbar so, dass Turtle nicht auf XML basiert: "Turtle is
extremely concise, extremely human-readable, and extremely
machine-readable. The only disadvantage is that it isn't XML."
http://djpowell.net/schemas/treetriples/1/SyntaxComparison.html
Mit RDF/XML scheint es übrigens nicht wenige Probleme zu geben, vgl.
diesen Blog-Post:
http://milicicvuk.com/blog/2011/07/21/problems-of-the-rdf-syntax/
Zitat: "It is believed that RDF/XML has significantly slowed the
adoption of RDF and the Semantic Web idea."
Hm, ist XML womöglich also nicht die Basis des Semantic Web, sondern
eher ein Stolperstein dafür?
Gänzlich neu wäre mir, dass - was Sie als "Tatsache" bezeichnen -
"FRBR, DDC etc. auf dieser XML Entwicklung aufbauen". FRBR ist ein
Entity-relationship model. Die ERM-Methodik (Definition von Entitäten
mit bestimmten Merkmalen, sowie den Beziehungen zwischen den
Entitäten) stammt aus dem Design relationaler Datenbanken und wurde, soweit
ich
weiß, in den 1970-er Jahren entwickelt. "XML" kommt im ganzen
FRBR-Bericht nirgends vor.
Außerdem wurde vor einigen Jahren eine objektorientierte Variante von
FRBR als formale Ontologie entwickelt (FBRRoo):
http://www.cidoc-crm.org/frbr_drafts.html
Auch dieses bewegt sich auf einer ganz anderen Ebene als der rein
syntaktischen, und XML wird nicht erwähnt.
Darum weise ich ja auf den Zusammenhang hin, weil es nicht überall
explizit deutlich gemacht wird.
Aber was für ein Zusammenhang soll das denn nun sein?
Gewiss gibt es seit einigen Jahren auch für FRBR eine Umsetzung in RDF/XML:
http://metadataregistry.org/schema/show/id/5.html
(vgl. dazu auch
http://www.ifla.org/files/cataloguing/frbrrg/namespace-report.pdf)
Ergibt sich daraus, dass FRBR auf XML aufbaut???
Auch gehen natürlich viele FRBRisierungs-Projekte mit Daten in
XML-Syntax um. Z.B. wurden in einem Projekt der Indiana University XML
Schema Definitions für FRBR entwickelt; man kann dort auch FRBRisierte
Daten in XML herunterladen: http://www.dlib.indiana.edu/projects/vfrbr/
Aber auch hier ist doch nicht XML der Bedeutungsträger, sondern das auf
FRBR beruhende Datenmodell.
Auch in der umfangreichen Literatur zu FRBR (von der ich gewiss nicht
alles, aber doch recht viel gelesen habe) bin ich nach meiner Erinnerung
nie auf die Aussage gestoßen, dass FRBR auf XML aufbauen würde.
Vielleicht könnten Sie meiner Erinnerung auf die Sprünge helfen und mir
einen einschlägigen Beleg aus der Literatur liefern?
Bei dieser Diskussion kam mir übrigens die Rezension eines anderen
Umstätter-Werkes in den Sinn - ausnahmsweise nicht von mir, sondern von
Joachim Eberhardt:
http://www.llb-detmold.de/wir-ueber-uns/aus-unserer-arbeit/texte/2010-1.html
Er wunderte sich darin u.a. über die Definition von "Intelligenz" und
kommentierte: "Es ist dem Rezensenten nicht gelungen, eine Quelle zu
finden, die diese Definition mit Umstätter teilt, was auch dadurch
erschwert wurde, dass er selbst keine angibt. Trotzdem genügt diese
Definition ihm, um "unzählige Laien, aber auch Wissenschaftler" dafür zu
tadeln, dass sie das Wort Intelligenz falsch gebrauchen (S. 53)."
Viele Grüße
Heidrun Wiesenmüller
--
---------------------
Prof. Heidrun Wiesenmüller M.A.
Hochschule der Medien
Fakultät Information und Kommunikation
Wolframstr. 32, 70191 Stuttgart
Tel. dienstl.: 0711/25706-188
Tel. Home Office: 0711/36565868
Fax. 0711/25706-300
www.hdm-stuttgart.de/bi
--
http://www.inetbib.de
Listeninformationen unter http://www.inetbib.de.