[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Zur Diskussion Informationsvisualisierung
Sehr geehrte Damen und Herren,
mit grossem Interesse verfolge ich seit einigen Tagen die Diskussion zur
Visualisierung von Rechercheergebnissen im Textretrieval.
Seit 1997 beschaeftigen wir uns an der Fachhochschule Potsdam in einer kleinen
Arbeitsgruppe mit Fragen der Web-basierten Strukturierung und Visualisierung
von Suchergebnissen aus Textretrievalsystemen.
Obwohl wir mit hohem Aufwand an prototypischen Loesungen arbeiten und zwei Real
World-Anwendugen im Netz stehen (Visuelles Interface fuer Nachrichtenservice
Newscan und Datenbank fuer Infowiss. Infodata), sind die bisherigen Erfahrungen
einer Kombination von Visualisierung und Textretrieval eher ernuechternd. Diese
Einschaetzung wird mittlerweile auch durch die InfoVis-Community, z.B. auf der
IEEE InfoVis 98, in den USA vertreten.
In der letzten Zeit haben zahlreiche Gruppen in der Informationsvisualisierung
aufgegeben und viele Projekte auf diesem Gebiet, u.a. bei Netscape, Apple,
XEROX, MIT, Microsoft oder der GMD wurden eingestellt. Der Grund dafuer liegt
meiner Ansicht nach darin, dass eine Entwicklung, die 1993 so euphorisch mit
dem XEROX Information Theater begann, nach 6 Jahren nicht die gewuenschten
Ergebnisse brachte und man heute kritischer hinterfragt, welchen informellen
Nutzen oder Mehrwert sogenannte Information Visualizer bringen und ob visuelles
Textretrieval in dieser Form ueberhaupt vom Nutzer angenommen wird.
Beides ist aus heutiger Sicht nicht geklaert.
Aus meiner Sicht gibt es in der Informationsvisualisierung eine ganze Reihe
fundamentaler Probleme, die in der Vergangenheit leider zu wenig Beachtung
fanden:
1. Das Problem der Aufbereitung und Strukturierung von Information.
Visualisierung kann die Qualitaet der Klassifikation, Clusterung oder
Indexierung nicht verbessern, oft werden gerade im Visualisierungprozess die
Schwaechen mangelnder Informationsaufbereitung besonders deutlich.
2. Das Problem des Handlings massenhafter Information.
Punktwolken, Informationsgebirge oder semantische Karten geben wenn ueberhapt
maximal einen groben Ueberblick, versagen jedoch bei der zielgerichteten Suche
nach Einzelinformationen. Visualisierung von semantischen Netzwerken versagen
vollstaendig bei ueberschreiten einer bestimmten Anzahl von Knoten und Links
(meist nur einige hundert).
3. Das Problem der visuellen Inhaltsbeschreibung.
Um die Komplexitaet von Begriffen oder Dokumentbeschreibungen darzustellen,
reichen in der Regel grafische Objekteigenschaften oder Symbole nicht aus.
Abstrakte Objekteigenschaften sind zudem nicht selbsterklaerend. Ohne Text geht
es also nicht. Die Lesbarkeit von Text in Karten oder Informationsraeumen ist
aber eines der groessten Probleme in der Visualisierung. Oft bevorzugt der
Nutzer gleich eine geordnete Textliste statt schwer erkennbarer
Textdarstellungen im Raum in einer Grafik.
4. Das Problem der Evaluation von Nutzerschnittstellen.
Eines der entscheidenden Probleme: Nutzerakzeptanz und Einbeziehung von
Nutzeranforderungen und Problemen im Retrieval bleibt oftmals schlichtweg
unbeachtet. Die Qualitaet von Entwicklungen auf diesem Gebiet HCI muessen sich
jedoch daran messen lassen, ob visuelle Metaphern von einem breiten
Anwenderkreis akzeptiert und benutzt werden. Es gibt allerdings nur wenige
erfolgreiche Information Visualizer ( z.B. Hotsauce, Hyperbolic Tree, Folder
Tree), wobei die ueberwiegende Mehrzahl nur Hierarchien darstellen.
5. Problem der Hierarchisierung.
Ca. 80% aller Visualiserungen im Bereich Informationsvisualisierung sind
Baumstrukturen und dazu in der Regel Dateimanager. Es gibt unzaehlige visuelle
Metaphern zur Darstellung einer hierarchischen Baumstruktur (2D, 3D,
Konzentrisch, hyperbolisch, linear, Folder, Landschaft, Karte etc.). Das
eigentliche Problem liegt allerdings darin Informationen und Wissen
hierarchisch zu organisieren. Hier liegt doch der Entwicklungsbedarf ganz
woanders.
6. Problem der inhaltlich-visuellen Assoziation.
Eines der Basiskonzepte in der Informationsvisualisierung ist die Assoziation
inhaltliche Naehe = koordinative (2D) bzw. raeumliche (3D) Naehe. Gerade aber
das Erkennen von raeumlichen Abstaenden bei raumbezogenen Simulationen ist
eines der Hauptprobleme in der Computergrafik bei der Verwendung flacher
Bildschirme.
7. Problem der semantischen Repraesentation von Text.
Es wird oft das Argument angefuehrt 'Ein Bild sagt mehr als tausend Worte', um
damit den Einsatz visueller Konzepte zu rechtfertigen. Bei Textdokumenten
trifft im allgemeinen genau der umgekehrte Fall zu. Man moege sich bloss einmal
vorstellen einen einfachen Satz bildlich zu beschreiben. Es waere ein Vergleich
zwischen Hochsprache und Bildersprache. Um Inhalte auf Symbolform zu
reduzieren, und um nichts anderes geht es in der Informationsvisualisierung,
bedarf es eines umfangreichen Lernprozesses (z.B. Zeichensprache oder
chinesische Schriftzeichen). Gerade das will man aber mit Hilfe der
Visualisierung vermeiden.
8. Problem der dynamischen Echtzeit-Visaulisierung.
Viele Verfahren erfordern ein zeitaufwendiges Pre-processing. Misst der
Web-benutzer die Retrievaleigenschaften eines online-Systems an den
Suchamschinen, so kommt es auf geringe Responsezeiten an. Mit moeglicht
einfachen Algorithmen eine qualitativ hochwertige Strukturierung und
Visualisierung zu erreichen ist derzeit ausserordentlich problematisch.
Fazit:
- Die Informationsvisiualisierung hat in der Vergangenheit zwei wesentliche
Hoffnungen, die im allgemeinen mit jeder Form der Visualisierung verbunden
sind: die bessere Interpretation von Massendaten und die Vereinfachung der
Komplexitaet der Welt nicht erfuellt.
- Die einfache Uebertragung von Visualisierungsverfahren aus der
wissenschaftlichen Visualisierung auf abstrakte Daten hat nicht funktioniert.
- Die Evaluation von Prototypen in der Informationsvisualisierung hat gar nicht
oder nur punktuell stattgefunden. Nutzeraspekte sind auf Grund des hohen
Aufwandes zu wenig in die Entwicklungen eingeflossen.
- Es wurden oftmals zuerst visuelle Aspekte beruecksichtigt sowie neueste
computergrafische Moeglichkeiten ausprobiert (z.B. VR) und erst in zweiter
Linie nach sinnvollen Anwendungen gesucht.
Insgesamt denke ich, dass sich die Informationvisualisierung derzeit in einer
Phase der Neuorientierung befindet. Insbesondere im Zusammenhang mit dem
Information Retrieval diskutiert wird ueberlegt, mehr als bisher die
Informationsaufbereitung-, strukturierung und filterung in den Vordergrund zu
stellen und dann verschiedene analytische und visuelle Tools als
Nutzerschnittstelle anzubieten. Die Perspektiven der Informationsvisualisierung
sehe ich mehr im Bereich des Data Mining und des Knowledge Discovery. Im
Vergleich zum Konzept des Information Theater ist hier die
Informationsvisualisierung integraler Bestandteil eines komplexen
Analysesystems.
Insofern bin ich zuversichtlich was die weitere Entwicklung auf diesem Gebiet
anbelangt, allerdings in einem veraenderten Kontext.
Zum Schluss noch unsere Quellen:
Eine zusammenfassende Darstellung zu Konzepten der InfoVis befindet sich in
Daessler und Palm, Virtuelle Informationsraeume mit VRML, dpunkt, 1998.
Visualisierung von Wirtschaftsnachrichten : http://www.newscan-online.de
Visuaulisierung von Rechercheergebnissen aus Datenbanken + textbasierte
kaskadierte Filterung von Suchergebnissen : http://fabdq.fh-potsdam.de/infodata
Ich bin Ihnen fuer die laufende Diskussion sehr dankbar und wuerde mir
wuenschen, dass insbesondere in Deutschland auf diesem Gebiet eine besserer
Austausch von Informationen stattfindet, da es eine ganze Reihe von neueren
aber isolierten Aktivitaeten zu geben scheint (siehe Referenzen DBI).
Vielleicht kann man so besser von den z.T. praktischen Erfahrungen anderer
Gruppen profitieren und muss nicht den schmerzlichen Weg gehen, das Rad neu zu
erfinden.
Vielen dank fuer Ihre Aufmerksamkeit.
Mit freundlischen Gruessen
Rolf Daessler
Listeninformationen unter http://www.inetbib.de.