[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Neue BASE Version im BASE Lab



Lieber Herr Eberhardt,

unsere FAST-Lizenz ließ keinen größeren Index zu, die Kosten für eine weitere 
Aufstockung waren für uns zu hoch. Ein weiterer Grund war die Ankündigung von 
Microsoft, dass FAST künftig nur noch auf Windows-Betriebssystemen laufen 
soll. 

Damit ist nicht gesagt, dass wir die FAST-Software "nicht toll" fanden. Ich 
habe ja aufgezählt, was z.B. im linguistischen Bereich mit Lucene/Solr erstmal 
alles nicht geht. Sicherlich könnte man Lucene/Solr z.B. mit der "Rosette 
Linguistics Platform“ ergänzen, das wäre im Endeffekt aber teurer als unsere 
FAST-Lizenz gewesen. Wir freuen uns aber jetzt, Teil der Lucene/Solr-Community 
zu sein und vielleicht können wir was zur Weiterentwicklung beitragen.

Über das zentrale Vascoda braucht man nicht mehr viel sagen, das HBZ will nach 
meinem Kenntnisstand auf Lucene/ElasticSearch setzen. Wenn Sie nach Migration 
von FAST zu Lucene recherchieren, werden Sie im Internet reichlich fündig 
werden.

Viele Grüße
Dirk Pieper



 


Am Dienstag, 15. Februar 2011 07:39:07 schrieb Eberhardt Joachim:
Lieber Herr Pieper,

Ihre Formulierung lässt offen, was denn nun genau der Grund ist für den
Umstieg: hat es mit Open Access zu tun oder mit dem "weiterhin starken
Anstieg" der Zahl der Dokumente?

Interessieren würde mich auch, warum Sie mit FAST unzufrieden sind - vor
ein paar Jahren haben wir ja gesehen, wie Vascoda, HBZ, UB Bielefeld, BSB
der Reihe nach auf FAST setzten. Schränken die Lizenzbedingungen das
Selbstexperimentieren ein? Ist FAST doch nicht so toll? Oder zu teuer?

 Fragt, mit freundlichem Gruß,

J. Eberhardt (LLB Detmold)

-----Ursprüngliche Nachricht-----
Von: inetbib-bounces@xxxxxxxxxxxxxxxxxx
[mailto:inetbib-bounces@xxxxxxxxxxxxxxxxxx] Im Auftrag von Dirk Pieper
Gesendet: Montag, 14. Februar 2011 13:49
An: inetbib@xxxxxxxxxxxxxxxxxx
Betreff: [InetBib] Neue BASE Version im BASE Lab

Liebe Kolleginnen und Kollegen,

um dem weiterhin starken Anstieg von
Open-Access-Publikationen auch in Zukunft gerecht werden zu
können, haben wir für BASE in den letzten Monaten intensiv
einen Plattform-Wechsel von FAST zu Lucene/Solr vorbereitet.
Eine erste Test- Version ist seit Kurzem im BASE Lab
freigeschaltet, welche Sie direkt unter

http://baselab.base-search.net/

betrachten können. Die "FAST-Version" von BASE unter der
bekannten Adresse
(http://www.base-search.net/) ist natürlich weiter in Betrieb.

Wie unterscheiden sich BASE und BASE Lab?

Inhalt:
Der BASE Index enthält rd. 25,5 Mio. Dokumenten aus 1.724
Quellen, der neue Index im BASE Lab enthält rd. 26,5 Mio.aus
1.693 Quellen. Der alte BASE Index wird nicht mehr
aktualisiert, das Harvesten von Dokumentenservern über
OAI-PMH geht natürlich weiter, was die höhere Dokumentenzahl
im BASE Lab erklärt. Ein Teil der Quellen konnte aus
technischen Gründen nicht in das BASE Lab übernommen werden,
neue Quellen werden nur noch für den neuen Index aufbereitet.
Die BASE API zeigt derzeit noch auf BASE und nicht auf BASE Lab.

Suche und Suchoberfläche:
Die Suchoberfläche im BASE Lab läuft unter VuFind.
VuFind-Funktionalitäten, die ein Login erfordern, sind
während des Tests im BASE Lab deaktiviert. Unter Lucene/Solr
ist vorerst keine multilinguale Suche (Eurovoc Thesaurus) und
keine automatische Schlagwortanreicherung für
deutschsprachige Dokumente möglich. Ebenso können wir derzeit
keine mehrsprachige Lemmatisierung (Wortformen-Suche),
sondern nur ein einfaches Stemming für englischsprachige
Suchbegriffe (Porter Stemmer) anbieten. Das bedeutet, dass
die Suchergebnisse von BASE unter FAST und BASE unter
Lucene/Solr - nicht nur aufgrund der unterschiedlichen
Dokumentenzahl - wenig vergleichbar sind. Neue
Funktionalitäten, wie das Abonnieren von RSS-Feeds oder
Versenden von Ergebnissen als EMail sind im BASE Lab schon
aktiv. Repository-Manager können den Stand ihrer
Dokumentenserver über die BASE-Lab-Quellenliste abfragen.

Wie geht es weiter?
Die vollständige Ablösung des FAST-Systems ist für die
nächsten Monate geplant, ebenso die Umlenkung der BASE API
auf den neuen Index. Der Index unter Lucene/Solr wird vorerst
in unregelmäßigen Abständen aktualisiert werden.

Diese und weitere Informationen finden Sie auch in unserem
neuen BASE Blog:

http://ekvv.uni-bielefeld.de/blog/base/

Über Feedback im BASE Blog zu unserer ersten Test-Version
würden wir uns natürlich freuen. Des Weiteren gibt es noch
einen weiteren Blog unter

http://ekvv.uni-bielefeld.de/blog/baseoai/

der sich an die internationale OAI-Community wendet.

Viele Grüße
Dirk Pieper




--
http://www.inetbib.de

-- 
http://www.inetbib.de

Listeninformationen unter http://www.inetbib.de.