[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

AW: Hochschulschriftenserver, Google, und wie es wohl weitergeht



> > Liebe Liste,
> >
> > der "Google-Scholar" (http://scholar.google.com/) ist durchaus eine
> > bemerkenswerte Entwicklung von Google, welche die
> > Internet-Suchtechnik
> > voranbringt - zumindest vordergruendig.
>
> Mich wuerde interessieren wie Google Scholar
> Literaturangaben in Texten identifiziert und ob fuer die
> Hochschulschriftenserversuche dergleichen ebenfalls moeglich ist.

Da Steve Lawrence zu Google gegangen ist, gehe ich davon aus, dass er die
Citeseer-Technologie (ACI = Autonomous Citation Indexing) gleich mitgenommen
hat. siehe http://www.neci.nj.nec.com/homepages/lawrence/citeseer.html
Das Verfahren funktioniert auf praktisch allen Dokumenten in PDF und PS und
ist dokumentiert.

> Wuenschenswert waere auch, dass bei jedem
> wissenschaftlichen Dokument die Metadaten nach OAI-Standard
> suchbar sind und umgekehrt bei Erfassung des Dokuments durch
> eine oeffentlichrechtliche Suchmaschine mehr oder minder
> automatisch Metadaten erstellt werden, die nach dem
> OAI-Standard allgemein nutzbar sind.

Das Problem ist, dass die Computer Science Papers in Citeseer aber auch Google
Scholar kaum Metadaten haben, siehe
http://citeseer.ist.psu.edu/page98pagerank.html und eigentlich nur über den
Volltext bzw. ihre Zitationen gefunden werden.

> Wir haben ja sehr grob gesprochen 2 Welten:
>
> Auf der einen Seite die Welt der Volltext-Suchmaschinen
> fuer wiss. Inhalte wie Google Scholar, Metager-HSS oder
> BASE (UB Bielefeld)
>
> Auf der andern Seite die Welt der Metadaten, die diese
> Dokumente ueber ihre Metadaten zugaenglich macht, wobei sich
> als Standard in den letzten Jahren OAI zu etablieren beginnt.
> Zu dieser Welt gehoeren auch die Bibliothekskataloge.
> Metadaten erlauben differenziertere Abfragen.
>
> Wie sollen an wissenschaftlichen Dokumenten interessierte
> Nutzer diese auffinden? Mit den Werkzeugen von Welt 1 oder
> den Suchinstrumenten von Welt 2, wobei hier etwa der OAIster
> genannt sei. Oder mit beiden?

Ja, wenn die Nutzer informiert sind, sollten sie heute mit beiden Welten
recherchieren. Die Informatiker finden aber das meiste in Citeseer oder
arxiv.org.
Vielleicht reicht bald nur noch eine Google Welt! Sie arbeiten zumindest
schwer daran.

Grüße,
Philipp Mayr


Listeninformationen unter http://www.inetbib.de.