[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Bibliographic Framework Transition Initiative



Lieber Herr Staecker,

Wiewohl ein Austauschformat obsolet scheint, geht es auch bei RDF
nicht ganz ohne Vereinbarungen.

Selbstverständlich beruht *jede* Art von Datenverarbeitung auf
Vereinbarungen. Einer der Schwachpunkte der alten Formate wie MARC ist
gerade der Mangel an Vereinbarungen, die auch von Maschinen verwertbar
sind. Stattdessen finden sich zahlreiche unklaren Vereinbarungen,
Hausregeln und kontextabhängigen Interpretationen, die nur für (einige)
Menschen verständlich sind. RDF löst auch dieses Problem auch nicht von 
alleine - sie können jedes noch zu ausgeklügelte System aushebeln, indem 
sie es mit Datenmüll füttern. RDF bietet jedoch im Gegensatz zu 
herkömlichen Verfahren einige Methoden, um das Problem zumindest 
abzumildern, z.B. durch Beschreibung und Mapping von Ontologien.

Was darf es z.B. für das Prädikat "Autor" sein:

dc:creator, mods:name, marc:100, pica:3000, mab:100, tei:author etc.

Bedauerlicherweise sind diese Prädikate der jeweiligen Ontolgie dann
auch nicht hunderprozentig kompatibel.

Das Zusammenführen eines Apfel-Datenbestand mit einem 
Birnen-Datenbestand in einen Obst-Datenbestand ist immer problematisch, 
unabhängig davon ob nun RDF-Prädikate oder andere Datenstrukturen mit 
Feldern, Kategorien o.Ä, verwendet werden. Das Sich-Einigen auf 
gemeinsame Vorstellung ist und bleibt immer Grundlage erfolgreicher 
Kommunikation.

Der Vorteil von RDF-Prädikaten ist allerdings, dass man dem Computer 
zumindest mitteilen kann, wenn man sich mal auf eine gemeinsame 
Vorstellung von Autor, Obst o.Ä geeinigt hat. Selbst wenn man etwas 
unterschiedliche Vorstellungen von Prädikaten und Klassen hat, z.B. 
"Hauptautor" vs. "Beitragender", so lassen sich mit RDF die 
Ontologie-Bestandteile aufeinander mappen. Für viele Anwendungen reichen 
auch grobe Mappings aus. Der Ansatz, erst auf 100% Korrektheit zu warten 
führt nur dazu, dass am Ende gar keine Daten nutzbar sind.

Was ich auch noch nicht ganz
verstehe, ist, wie die Identifizierung der Objekte über URIs
sichergestellt werden kann, denn eine owl:sameAs Relation über alle
möglichen Identifier wird sicher wenig praktikal sein bzw. habe ich
in den Beispielen, die ich kenne, noch nicht gesehen.

Im Idealfall einigt man sich auf einen Identifier pro Objekt. 
Andernfalls stellt man Mappings mit owl:sameAs u.Ä. bereit. 
Grundsätzlich besteht die Strategie darin, *erst* zu schauen, ob schon 
URIs existieren, bevor jeder seine eigenen URIs prägt. Beispielsweise 
finden sich viele Konzepte als DBPedia-URIs oder in den bereits nach RDF 
gemappten Normdaten (GND, VIAF etc.).

Schöne Grüße
Jakob Voß

-- 
Jakob Voß <jakob.voss@xxxxxx>, skype: nichtich
Verbundzentrale des GBV (VZG) / Common Library Network
Platz der Goettinger Sieben 1, 37073 Göttingen, Germany
+49 (0)551 39-10242, http://www.gbv.de

-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.