[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] Neue BASE Version im BASE Lab



Liebe Kolleginnen und Kollegen,

um dem weiterhin starken Anstieg von Open-Access-Publikationen auch in Zukunft 
gerecht werden zu können, haben wir für BASE in den letzten Monaten intensiv 
einen Plattform-Wechsel von FAST zu Lucene/Solr vorbereitet. Eine erste Test-
Version ist seit Kurzem im BASE Lab freigeschaltet, welche Sie direkt unter 

http://baselab.base-search.net/

betrachten können. Die "FAST-Version" von BASE unter der bekannten Adresse 
(http://www.base-search.net/) ist natürlich weiter in Betrieb.

Wie unterscheiden sich BASE und BASE Lab?

Inhalt:
Der BASE Index enthält rd. 25,5 Mio. Dokumenten aus 1.724 Quellen, der neue 
Index im BASE Lab enthält rd. 26,5 Mio.aus 1.693 Quellen. Der alte BASE Index 
wird nicht mehr aktualisiert, das Harvesten von Dokumentenservern über OAI-PMH 
geht natürlich weiter, was die höhere Dokumentenzahl im BASE Lab erklärt. Ein 
Teil der Quellen konnte aus technischen Gründen nicht in das BASE Lab 
übernommen werden, neue Quellen werden nur noch für den neuen Index 
aufbereitet. Die BASE API zeigt derzeit noch auf BASE und nicht auf BASE Lab.

Suche und Suchoberfläche:
Die Suchoberfläche im BASE Lab läuft unter VuFind. VuFind-Funktionalitäten, 
die ein Login erfordern, sind während des Tests im BASE Lab deaktiviert. Unter 
Lucene/Solr ist vorerst keine multilinguale Suche (Eurovoc Thesaurus) und 
keine automatische Schlagwortanreicherung für deutschsprachige Dokumente 
möglich. Ebenso können wir derzeit keine mehrsprachige Lemmatisierung 
(Wortformen-Suche), sondern nur ein einfaches Stemming für englischsprachige 
Suchbegriffe (Porter Stemmer) anbieten. Das bedeutet, dass die Suchergebnisse 
von BASE unter FAST und BASE unter Lucene/Solr - nicht nur aufgrund der 
unterschiedlichen Dokumentenzahl - wenig vergleichbar sind. Neue 
Funktionalitäten, wie das Abonnieren von RSS-Feeds oder Versenden von 
Ergebnissen als EMail sind im BASE Lab schon aktiv. Repository-Manager können 
den Stand ihrer Dokumentenserver über die BASE-Lab-Quellenliste abfragen.

Wie geht es weiter?
Die vollständige Ablösung des FAST-Systems ist für die nächsten Monate 
geplant, ebenso die Umlenkung der BASE API auf den neuen Index. Der Index 
unter Lucene/Solr wird vorerst in unregelmäßigen Abständen aktualisiert 
werden.

Diese und weitere Informationen finden Sie auch in unserem neuen BASE Blog:

http://ekvv.uni-bielefeld.de/blog/base/

Über Feedback im BASE Blog zu unserer ersten Test-Version würden wir uns 
natürlich freuen. Des Weiteren gibt es noch einen weiteren Blog unter

http://ekvv.uni-bielefeld.de/blog/baseoai/

der sich an die internationale OAI-Community wendet.

Viele Grüße
Dirk Pieper




-- 
http://www.inetbib.de


Listeninformationen unter http://www.inetbib.de.