[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: (Fwd) Re: Anreicherung von Katalogen / dandelon.com
- Date: Thu, 24 Jun 2004 15:01:11 +0200
- From: Frank Hoppe <hoppe@xxxxxxxxxxxxxxx>
- Subject: Re: (Fwd) Re: Anreicherung von Katalogen / dandelon.com
Lieber Herr Umstätter,
erlaubt sei der Einwand, dass der Bezug der Informationtheorie auf die
Entropie wohl dann jedenfalls quantitativ messbar ist, wenn der jeweilige
Raum, in der die Information sich vergrößert, als fest und wohl definiert
gilt. Wie bekannt, hat man enormen Aufwand zu betreiben, um Entropie in
offenen Systemen exakt mathematisch zu beschreiben. Der Raum, über den wir
hier reden, bezieht also immer den Informationssuchenden und das
Informationsdepot als Ganzes mit ein, sei es in der Bibliothek von Aby Warburg
plus wandelndem Wissenschaftler oder der Dokumentar mit 'seinen' täglich
abgefragten Datenbanken. Wer von diesen beiden Systemen sozusagen den höheren
Grad der Entropieminderung erreicht - und damit auch der vorteilhaftere
Informationsraum ist - läßt sich so ohne weiteres wohl nicht sagen.
Sind die Betrachtungen hier noch recht statisch, weil in einem fest
vorgegebenen System erörtert, so ist der Aspekt der Informationsadaption als
Prozess ebenfalls noch wichtig. Manfred Spitzer beleuchtet in seinem Buch
'Lernen', wobei auch er wieder hier auf Geistesgrößen steht, den Aspekt des
Lernens als Prozess. Die Sprachentwicklung eines Menschen ist allein auch
deswegen erfolgreich, weil in jedem Entwicklungsstadium ganze
'Informationsblöcke' erst einmal ausgeblendet werden, um später dann auf
höherer Entwicklungsstufe doch ausgewertet werden zu können. Ein System, in
diesem Fall das menschliche Nervensystem, dass diese Fähigkeit nicht besitzt,
ist überhaupt nicht in der Lage, Information zu verarbeiten.
Kommen wir also zurück auf das Thema Kataloganreicherung. Zwar mag das alles
geboten sein, allein fördert es den besagten Prozess der
Informationsverdichtung als förderndes Instrument zum Erkenntnisgewinn ?
Gruß Hoppe
Walther Umstätter <h0228kdm@xxxxxxxxxxxxxxx> wrote ..
> Bernhard Eversberg wrote:
>
> >On 23 Jun 04, at 18:53, Walther Umstätter wrote:
> >
> >
> >
> >>Nichts gegen Bardot, aber in allen statistischen Fragen Sagen Computer
> >>grundsätzlich nur vielleicht.
> >>
> >>
> >>
> >Nein! Auch dies ist wieder eine euphemistisch-metaphorische Sichtweise.
> >Sie geben Zahlen aus, und der menschliche Betrachter interpretiert diese
> als
> >"vielleicht". Das ist was anderes! Die Zahlen ergeben sich in jedem Fall
> aus
> >einer langen Sequenz von Ja-Nein-Entscheidungen, das "vielleicht" ergibt
> sich
> >erst auf einer höheren Ebene außerhalb des Rechners. Und wenn man
> >einprogrammiert, dass er innerhalb bestimmter Grenzen eben das Wort
"vielleicht"
> >ausgeben soll, heißt das noch keineswegs, dass er was verstanden hat.
> Er hat nur
> >die Frage, ob der Wert zwischen den Grenzen liegt, beantwortet, und zwar
> mit "ja".
> >
> >
> Das ist richtig. Statistik hat mit begrifflichem Verstehen nichts zu tun.
> Man muss aber erkennen, dass ein Ja/Nein auf mikroskopischer Ebene, auf
> allen höheren Ebenen
> (z.B. bei großen Zahlen oder Mengen) ein zunehemendes Vielleicht bedeutet,
> bis hin zum völlig unbestimmten Unendlich. Das ist weit mehr Realismus
> als Euphemismus.
>
> >>Ansonsten lässt sich der Paradigmenwechsel vom Determinismus des
> >>Laplaceschen Dämons,
> >>hin zu dem rein wahrscheinlichkeitstheoretischen des Maxwellschen Dämons
> >>nirgends so genau verfolgen,
> >>wie in der Informationstheorie, die ja auf den Erkenntnissen zur
> >>Entropie beruht.
> >>
> >>
> >... und ganz falsch benannt ist, weil sie sich eben nicht mit Information
> im
> >landläufigen Sinne befasst, sondern mit der Übermittlung von Nullen und
> Einsen
> >und den dabei auftretenden Fehlern. Eins der schlimmsten Beispiele fuer
> eine
> >euphemistische Metapher.
> >
> >
> Das ist richtig. Die Informationstheorie beschäftigt sich mit dem
> wissenschaftlich fundierten Informationsbegriff,
> nicht mit landläufigen Homonymen.
>
> >>... können Indexierer, mit einem guten Thesaurus das semantische
> >>Problem durchaus abmildern,
> >>wenn sie im Thesaurus eine klare Begrifflichkeit schaffen und,
> >>gleichgültig ob ein Autor von einem Register, einem Index, einem
> >>Inhaltsverzeichnis,
> >>einer Wortliste, einer Datei oder einem Directory schreibt,
> >>"inverted file" indexen, wenn es sich um einen solchen handelt.
> >>
> >>Das ist ein wichtiger Teil der Qualitätssicherung in Bildung und
> >>Wissenschaft,
> >>um die sich Bibliotheken schon immer gekümmert haben,
> >>wenn sie inhaltlich (also begrifflich) zusammengehöriges auswählten und
> >>zusammenbrachten.
> >>
> >>
> >
> >So ist es. Anreicherungen der beschriebenen Art können das unterstützen,
> aber sie
> >erhöhen neben dem recall leider auch die imprecision. Doch Google-gegerbte
> Sucher
> >kennen es nicht anders.
> >
> >Das führt aber zu der Überlegung, dass man in angereicherten Katalogen
> unbedingt
> >die Möglichkeit braucht, die "normalen" Titelaufnahmedaten und
Schlagwörter
> >getrennt abfragen zu können, und daß diese auch nicht qualitiativ
nachlassen
> >dürfen. Sonst würde man bei Millionenmengen zu oft mit allzu großen
> >Ergebnismengen überschüttet, wenn man nur den einen Einwurfschlitz für
> >undifferenzierte Wortmünzen hätte.
> >
> >MfG B.E.
> >
> >
> >
> Genau desswegen sehe ich im Moment auch keine wirklich tragfähige
> Alternative zu XML,
> wo man über entsprechende DTDs einerseits wie bisher Felder für
> Titelaufnahmen, Schlagwörter etc.
> einrichten kann, und andererseits Semiotik bzw. Begrifflichkeit über
> Metadaten mit einbringt,
> die sich an Ontologien oder semiotische Thesauri knüpfen lassen.
>
> MfG
>
> Umstätter
Listeninformationen unter http://www.inetbib.de.