[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Bibliographic Framework Transition Initiative
- Date: Thu, 15 Mar 2012 13:00:36 +0100
- From: Jakob Voss <jakob.voss@xxxxxx>
- Subject: Re: [InetBib] Bibliographic Framework Transition Initiative
Lieber Herr Staecker,
Wiewohl ein Austauschformat obsolet scheint, geht es auch bei RDF
nicht ganz ohne Vereinbarungen.
Selbstverständlich beruht *jede* Art von Datenverarbeitung auf
Vereinbarungen. Einer der Schwachpunkte der alten Formate wie MARC ist
gerade der Mangel an Vereinbarungen, die auch von Maschinen verwertbar
sind. Stattdessen finden sich zahlreiche unklaren Vereinbarungen,
Hausregeln und kontextabhängigen Interpretationen, die nur für (einige)
Menschen verständlich sind. RDF löst auch dieses Problem auch nicht von
alleine - sie können jedes noch zu ausgeklügelte System aushebeln, indem
sie es mit Datenmüll füttern. RDF bietet jedoch im Gegensatz zu
herkömlichen Verfahren einige Methoden, um das Problem zumindest
abzumildern, z.B. durch Beschreibung und Mapping von Ontologien.
Was darf es z.B. für das Prädikat "Autor" sein:
dc:creator, mods:name, marc:100, pica:3000, mab:100, tei:author etc.
Bedauerlicherweise sind diese Prädikate der jeweiligen Ontolgie dann
auch nicht hunderprozentig kompatibel.
Das Zusammenführen eines Apfel-Datenbestand mit einem
Birnen-Datenbestand in einen Obst-Datenbestand ist immer problematisch,
unabhängig davon ob nun RDF-Prädikate oder andere Datenstrukturen mit
Feldern, Kategorien o.Ä, verwendet werden. Das Sich-Einigen auf
gemeinsame Vorstellung ist und bleibt immer Grundlage erfolgreicher
Kommunikation.
Der Vorteil von RDF-Prädikaten ist allerdings, dass man dem Computer
zumindest mitteilen kann, wenn man sich mal auf eine gemeinsame
Vorstellung von Autor, Obst o.Ä geeinigt hat. Selbst wenn man etwas
unterschiedliche Vorstellungen von Prädikaten und Klassen hat, z.B.
"Hauptautor" vs. "Beitragender", so lassen sich mit RDF die
Ontologie-Bestandteile aufeinander mappen. Für viele Anwendungen reichen
auch grobe Mappings aus. Der Ansatz, erst auf 100% Korrektheit zu warten
führt nur dazu, dass am Ende gar keine Daten nutzbar sind.
Was ich auch noch nicht ganz
verstehe, ist, wie die Identifizierung der Objekte über URIs
sichergestellt werden kann, denn eine owl:sameAs Relation über alle
möglichen Identifier wird sicher wenig praktikal sein bzw. habe ich
in den Beispielen, die ich kenne, noch nicht gesehen.
Im Idealfall einigt man sich auf einen Identifier pro Objekt.
Andernfalls stellt man Mappings mit owl:sameAs u.Ä. bereit.
Grundsätzlich besteht die Strategie darin, *erst* zu schauen, ob schon
URIs existieren, bevor jeder seine eigenen URIs prägt. Beispielsweise
finden sich viele Konzepte als DBPedia-URIs oder in den bereits nach RDF
gemappten Normdaten (GND, VIAF etc.).
Schöne Grüße
Jakob Voß
--
Jakob Voß <jakob.voss@xxxxxx>, skype: nichtich
Verbundzentrale des GBV (VZG) / Common Library Network
Platz der Goettinger Sieben 1, 37073 Göttingen, Germany
+49 (0)551 39-10242, http://www.gbv.de
--
http://www.inetbib.de
Listeninformationen unter http://www.inetbib.de.