[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Thomson Reuters und Google kooperieren



Lieber Herr Kuhlen,
ich befürchte auch, dass wir aus unseren „informationswissenschaftlichen Traditionen“ immer weniger weiter vermitteln können. Abgesehen von wirklich wichtigen Grundlagen, wie der Informationstheorie ;-)

Wir hatten seit dem Beginn der Digitalisierung ein unglaubliches Wachstum, bei dem immer größere Mengen an Daten auf Giga-, Tera-, Peta- oder Exabyt-Speichern Platz fanden. Aus diesen gewachsenen Mengen kann und muss nun die Information und das wirklich wichtige Wissen herausgefiltert werden, um all das Rauschen und die überflüssige Redundanz zu beseitigen. Das ist die Aufgabe bei Big Data, nachdem ja schon etliche Betroffene über die immensen Datenfriedhöfe geklagt haben. Da gibt es neben statistischen und wahrscheinlichkeitstheoretischen, bis zu selbstlernenden Strategien, auch das Data Mining, die Knowledge Acquisition, Bayesian Inference, Data Analysis, oder auch die ganz einfache gezielte Recherche nach bestimmten Wissensinhalten. Wobei man solche Recherchen ja auch automatisieren kann. Mir macht nur Sorge, dass wir in diesem Tätigkeitsfeld noch nicht einmal ausreichend zwischen Daten, Information und Wissen unterscheiden, obwohl ja nur das Wissen wirklich wichtig ist, weil es mit seiner jeweiligen Begründung die ausreichende Verlässlichkeit mitbringt. Wenn ich bei MGI lese, “liability will need to be addressed in a big data world”, dann ist es der eigentliche Knackpunkt, der ja auch schon bei der NSA Sorgen bereitet. Wie verlässlich sind die Ergebnisse aus den Big Data, wenn sie nicht auf einem gut begründeten Fundament aufsetzen. Bezüglich der Befürchtungen von Prof. Reuß, reicht es sicher nicht alle Leser terroristischer Literatur (von der ich vermute, dass sie in Öffentlichen Bibliotheken eher Mangelware ist) herauszufiltern. Das ist keine vernünftige Begründung für einen entsprechenden Verdacht, da ich sehr hoffe, dass auch die Gegner der Terroristen solche Machwerke lesen, damit sie wissen woher die Gefahr wirklich kommt.

Die Natur hat für solchen Datenüberfluss (und dessen Redundanz zur Sicherung des Wissens ist immens in jeder lebenden Zelle) das Vergessen und das Sterben in die Schwarmintelligenz der Biogenetischen Evolutionsstrategie eingebaut, und daraus können wir nur lernen, denn das Ergebnis ist das immense Wissen in Pflanze, Tier und Mensch.

Zum Semiotischen Thesaurus möchte ich mich hier nicht weiter auslassen, da ich hierzu einiges in "Zwischen Informationsflut und Wissenswachstum" geschrieben habe.

MfG
Walther Umstätter

P.S. Bezüglich einer europäischen Konkurrenz zu Google will ich nicht ausschließen, dass man durch ein anderes (besseres) Ranking auf Dauer gegen Google gewinnen könnte, da ich dort z.Z. interessante Veränderungen bei One Term Searches beobachte. Außerdem scheint Google im Moment den Verlagsinteressen nachzugeben. Außerdem wächst die Gefahr, dass Google uns in Such-Blasen gefangen hält. Trotzdem sehe ich mehr Chancen darin, mögliche Entwicklungsfehler anzumahnen und nachzuweisen, als einen solchen Giganten nachzubauen. Das ist alte Onliner Tradition, als wir Retrievalsysteme wie Grips/Dirs, Dialog ettc. analysierten und Fehler aufzeigten.



Am 2013-11-12 20:12, schrieb Rainer Kuhlen:
Lieber Herr Umstätter
macht es wirklich Sinn, weiter von semantischen Netzen und
semiotischen Thesauri zu sprechen- so schön es wäre, wenn unsere
informationswissenschaftlichen Traditionen überleben könnten?
Wie man überdeutlich an Verfahren wie automatische Übersetzung oder
Sprecherkennung, erst bei jeder Form von Web-Technologie sieht,
beruhen gegenwärtige Wissensverarbeitung und Informationserarbeitung
kaum noch auf den klassischen Paradigma der dokumentarischen oder
linguistischen Wissensrepräsentationsverfahren, sondern auf der
komplexen statistischen Auswertung großer Datenmengen, erst recht mit
Blick auf Suchmaschinen. Text/Data Mining ist das Paradigma, nicht
intellektuelle oder maschinelle WR (vgl. McKinsey Global Institute.
(2011, June). Big Data: The Next Frontier for Innovation, Competition,
and Productivity. Available at, http://bit.ly/16Tddz2). Als Ergänzung
zu Google weiter auf semiotische Thesauri zu setzen, wird Europa kaum
an die vorderste Front bringen. Was nötig ist, sind große
Investitionen eben in Big Data Technologie, so wie es derzeit in Big
Data Valley in Kalifornien geschieht. Vielleicht haben aber Sie, Herr
Umstätter andere bislang unbekannte Argumente für Ihr Setzen auf
Semiotik+Thesaurus - vor allem auch Argumente, die kompatibel mit
Ihrer Informationstheorie-Überzeugung sind.
RK
Am 09.11.2013 12:04, schrieb Walther Umstaetter:

Um es an dieser Stelle deutlich zu sagen, ich glaube dass es besser
wäre, neben Google in Europa eine Wissensbank als Ergänzung im Sinne
eines definitorischen semiotischen Thesaurus aufzubauen, als den
Versuch zu unternehmen, zu Google ein Konkurrenz zu schaffen. Anders
gesagt, eine Fortentwicklung des Internets auf der Basis von Google
und Wikipedia macht Europa unverziichtbarer, als der Versuch, die USA
mit einer Konkurrenz zu Google zu beeindrucken.


MfG
Walther Umstätter


--
Prof. Dr. Rainer Kuhlen
Department of Computer and Information Science
University of Konstanz, Germany

Website: www.kuhlen.name
Email: rainer.kuhlen@xxxxxxxxxxxxxxx
Skype: rainer.kuhlen
Blog: www.netethics.net
Facebook: http://www.facebook.com/rainer.kuhlen
Twitter: @rkinf
ORCID author identity: 0000-0002-4497-6422

--
http://www.inetbib.de

Listeninformationen unter http://www.inetbib.de.