[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Kooperation zwischen BSB und google
- Date: Sat, 10 Mar 2007 01:56:17 +0100 (CET)
- From: Lars Aronsson <lars@xxxxxxxxxxx>
- Subject: Re: [InetBib] Kooperation zwischen BSB und google
Rohde Bernd wrote:
Wir haben in diesem Fall einen Abschnitt "Schlüsselbegriffe" -
was wohl unseren Schlagwörtern entspricht, diese vermutlich
nicht dadurch gewonnen, dass sie von einem Fachreferenten
vergeben werden, sondern maschinell aus dem Text entnommen sind.
Und mit Algorithmen die **sicher künftlich verbessert** werden.
Für Werke auf schwedisch, z.B.
http://books.google.com/books?id=mnsCAAAAQAAJ
sind diese "key words and phrases" fest nur Präpositionen, also
einfach die häufigst vorkommende Wörter der Sprache:
för, motsats till, yttre, ett ord, eller, dem som, formen, men
till, inre, ord och, icke, med andra, innefattar, den som, äfven
d.h.: für, Gegensatz zu, äußere, ein Wort, oder, die, Form, aber
zu, innere, Wort und, nicht, mit anderen, inkludiert, wer, auch
:-)
Solche "Textmining"-Algorithmen sind Googles Stärke. Schon acht
Jahren haben sie diese Algorithmen auf Webseiten geübt, und nun
auch auf älteren eingescannten Büchern mit unvollständiger OCR.
Katalogisierung, Bibliografie und Intertextualität (wer hat dieses
geschrieben, wann, warum, für wen, und mit welchen Influenzen?)
ist (noch) nicht Googles Stärke. Wer diese Stärken besitzt
(ProQuest? OCLC?) und genug Geld, kann Google kaufen. Oder wird
vielleicht von Google gekauft.
--
Lars Aronsson (lars@xxxxxxxxxxx)
Aronsson Datateknik - http://aronsson.se
Listeninformationen unter http://www.inetbib.de.