[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] HatSchonWer: Die GND mit Solr indexiert
- Date: Mon, 31 May 2010 12:55:22 +0200
- From: Uwe Reh <reh@xxxxxxxxxxxxxxxxxxxxxx>
- Subject: Re: [InetBib] HatSchonWer: Die GND mit Solr indexiert
Liebe Liste,
vielen Dank für die Antworten und Anregungen. Leider hatte ich in meiner
Anfrage vergessen zu erwähnen worum es mir geht, damit habe ich
Rückfragen provoziert. Ich bitte um Entschuldigung und will es jetzt
nachholen.
Trotz theoretischen Wissens über Lucene und über Linked Data fehlt es
mir etwas an der Praxis. Dies wollte ich nachholen, in dem ich die für
mich aktuell spannendsten Projekte kombiniere:
- Solr, weil die meisten für mich relevanten Projekte eher auf Solr
aufsetzen als Lucene direkt einzubinden.
- GND, obwohl auch in unserem Verbundkatalog die ganze Liste der
Normdaten PND, GKD, SWD, ... enthalten ist, finde ich es spannender die
als Linked Data veröffentlichte Version der Normdaten in ein eigenes
Suchsystem zu hauen.
Für den Fall, dass die GND mal Linked OPEN Data werden sollte. ;-)
Damit beantwortet sich die Frage von Sascha Szott:
wollen Sie Ihre vorhandenen (bereits mit Solr indexierten Daten)
anreichern oder geht es Ihnen lediglich um ein Retrieval in den von der
DNB bereitgestellten RDF-Daten?
Auch wenn Sie es befürchtet haben, es geht mir 'nur' um das Retrival.
Allerdings hilft mir der XPathEntityProcessor wenig weil ich die
Lieferung im N-Triple-Format verwenden möchte. (Ist auch kein Problem,
aber ich hatte gedacht, es hätte schon jemand einen eigenen
(pre)Processor geschrieben)
@Joachim
Danke für den Tip mit sparqlite, aber ich versuche mich gerade aus
meinem Denkkorsett der klassischen Kataloge zu lösen. Darum erst mal Solr.
@Till
Das Heilige Römische Reich Deutscher Nation
(http://de.wikipedia.org/wiki/Heiliges_R%C3%B6misches_Reich) ist einfach
das Standardbeispiel für schlechte Einbindung von Normdaten. Auch bei
HeBIS und sogar bei der DNB erhält mensch so imposante Treffermengen.
Als Gegenbeispiel kann ich dir aber das Schlagwort "Computerlinguistik"
(Synonym zu >http://d-nb.info/gnd/4035843-4) geben. Noch sind Dewey, RVK
und andere Klassifikationen in den Katalogen noch nicht so verbreitet,
dass wir darauf verzichten können.
Genug SWD, du hast geschrieben:
Mit der GND haben wir noch nichts gemacht. Wir kämpfen derzeit mit der
sinnvollen Anwendung von Normdaten, wie sie klassisch genutzt werden
Damit kämpfen viele und ich hoffe von euren Erfahrungen profitieren zu
können. Ich will versuchen etwas gegen den Strich zu denken. Was spricht
dagegen, unter einer Oberfläche zwei oder mehrere Indices zusammenzufassen?
Zum Beispiel einen für die Normdaten und einen für die Titeldaten, also
den uralten Gedanken des Normalisierens auch auf Indices anzuwenden. OK,
bei den heutigen Plattenkapazitäten macht sich die Ersparnis von
einigen/vielen Gigabyte im Index nicht wirklich bemerkbar aber ich
vermute, das die Vorteile im Handling die aufwendigere Bearbeitung von
Suchanfragen wieder wett machen.
Nochmal Danke an Alle
Viele Grüße
Uwe Reh
--
http://www.inetbib.de
Listeninformationen unter http://www.inetbib.de.