[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] HatSchonWer: Die GND mit Solr indexiert



Liebe Liste,

vielen Dank für die Antworten und Anregungen. Leider hatte ich in meiner Anfrage vergessen zu erwähnen worum es mir geht, damit habe ich Rückfragen provoziert. Ich bitte um Entschuldigung und will es jetzt nachholen.

Trotz theoretischen Wissens über Lucene und über Linked Data fehlt es mir etwas an der Praxis. Dies wollte ich nachholen, in dem ich die für mich aktuell spannendsten Projekte kombiniere:

- Solr, weil die meisten für mich relevanten Projekte eher auf Solr aufsetzen als Lucene direkt einzubinden. - GND, obwohl auch in unserem Verbundkatalog die ganze Liste der Normdaten PND, GKD, SWD, ... enthalten ist, finde ich es spannender die als Linked Data veröffentlichte Version der Normdaten in ein eigenes Suchsystem zu hauen.
Für den Fall, dass die GND mal Linked OPEN Data werden sollte. ;-)

Damit beantwortet sich die Frage von Sascha Szott:
wollen Sie Ihre vorhandenen (bereits mit Solr indexierten Daten)
anreichern oder geht es Ihnen lediglich um ein Retrieval in den von der
DNB bereitgestellten RDF-Daten?
Auch wenn Sie es befürchtet haben, es geht mir 'nur' um das Retrival. Allerdings hilft mir der XPathEntityProcessor wenig weil ich die Lieferung im N-Triple-Format verwenden möchte. (Ist auch kein Problem, aber ich hatte gedacht, es hätte schon jemand einen eigenen (pre)Processor geschrieben)

@Joachim
Danke für den Tip mit sparqlite, aber ich versuche mich gerade aus meinem Denkkorsett der klassischen Kataloge zu lösen. Darum erst mal Solr.

@Till
Das Heilige Römische Reich Deutscher Nation (http://de.wikipedia.org/wiki/Heiliges_R%C3%B6misches_Reich) ist einfach das Standardbeispiel für schlechte Einbindung von Normdaten. Auch bei HeBIS und sogar bei der DNB erhält mensch so imposante Treffermengen. Als Gegenbeispiel kann ich dir aber das Schlagwort "Computerlinguistik" (Synonym zu >http://d-nb.info/gnd/4035843-4) geben. Noch sind Dewey, RVK und andere Klassifikationen in den Katalogen noch nicht so verbreitet, dass wir darauf verzichten können.
Genug SWD, du hast geschrieben:
Mit der GND haben wir noch nichts gemacht. Wir kämpfen derzeit mit der
sinnvollen Anwendung von Normdaten, wie sie klassisch genutzt werden
Damit kämpfen viele und ich hoffe von euren Erfahrungen profitieren zu können. Ich will versuchen etwas gegen den Strich zu denken. Was spricht dagegen, unter einer Oberfläche zwei oder mehrere Indices zusammenzufassen? Zum Beispiel einen für die Normdaten und einen für die Titeldaten, also den uralten Gedanken des Normalisierens auch auf Indices anzuwenden. OK, bei den heutigen Plattenkapazitäten macht sich die Ersparnis von einigen/vielen Gigabyte im Index nicht wirklich bemerkbar aber ich vermute, das die Vorteile im Handling die aufwendigere Bearbeitung von Suchanfragen wieder wett machen.



Nochmal Danke an Alle

Viele Grüße
Uwe Reh

-- 
http://www.inetbib.de

Listeninformationen unter http://www.inetbib.de.