[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Frage von Herrn Sander-Beuermann: Visualisierung in Suchmaschinen
- Date: Wed, 29 Aug 2007 10:05:47 +0200
- From: Manfred.Hauer@xxxxxxxxxx
- Subject: Re: [InetBib] Frage von Herrn Sander-Beuermann: Visualisierung in Suchmaschinen
Lieber Herr Dr. Sander-Beuermann,
hier ein paar Gedanken zu Ihrer Frage zum Thema Visualisierung von
Suchmaschinen:
DOS war so praktisch, kein Overhead an Grafik, schnell ... so dachten wohl
viele, als Microsoft die Ideen von Xerox und Apple uebernahmen. Lange her,
aber die heutige Generation kommt mit einem Kommando-gefuehrten Interface
gar nicht mehr zurecht, es muss unbedingt MS-Windows sein. Auch der Sprung
im Internet zum WWW war ein Sprung in grafische Welten und hypertextuelle
Strukturen (html). Ohne WWW staenden wir alle heute dumm da. Oder: wenn
Sie morgens ins Buero fahren, waere jedes Verkehrszeichen nur als Text
beschriftet kaeme es zu massenhaft mehr Unfaellen. Wir erkennen gewohnte
Bilder sehr schnell, schneller als Textnachrichten.
Also: Visualisierung hat ganz sicher seinen Sinn und kann sehr effizient
sein.
Visualisierung hat zwei Aspekte: 1. der Ort im Raum und 2. die Art der
Repraesentation.
1. Waeren die Verkehrszeichen staendig in verschiedener Hoehe, mal laengs,
schraeg oder quer zur Fahrbahn oder auf dem Boden oder quer ueber der
Strasse, schon haetten wir wieder neue Probleme. Ich muss mich als Nutzer
auf moeglichst immer gleichartige Positionen verlassen koennen. So steht
"File" oder "Datei" oder "X" mittlerweile bei fast allen Oberflaechen
immer oben links als eine Art Grundnavigation. Hier hat sich eine
Raumstruktur defacto durchgesetzt.
Finde ich z.B. in einer Wohnung ein wohl entwendetes echtes
Verkehrsschild, weiss ich genau, dass das Zeichen hier nicht gilt - der
Kontext definiert die Gueltigkeit und Bedeutung.
2. Die Repraesentation ist ein gar nicht triviales Problem - winzige
Bildchen sollen evtl. etwas komplexes darstellen. Die Lupe, der Drucker,
die (alte) Diskette - das versteht man noch (obwohl fast keiner mehr
Disketten einsetzt - ein USB waere heute eigentlich plausibler und Drucker
sind heute oft auch Scanner und Faxgeraete zugleich). Die Grundbefehle
eines Betriebssystems sind gar nicht soviele und noch recht analog
darstellbar.
Wenn man nun aber Gott und die Welt visualisieren will, wo ist dann der
Ort? Was das Symbol? Verstaendlich ueber Generationen und Kontinente
hinweg? Im Retrieval geht es um Gott und die Welt - es geht um wohl einige
hundert Millionen Begriffe und ihre Varianten. Es geht um Beziehungen und
Strukturen zwischen Begriffen, Dokumenten, Teilen von Dokumenten, Saetzen,
Elementen aus Saetzen und Tabellen, Bild, Ton, Bewegtbild, Animation,
Workflow, geografischer Ort, sozialer Ort, Avatar und natuerlich auch
Menschen (und sicher fehlt hier noch vieles in meiner Aufzaehlung). Und
selbst wenn man fuer alles ein Symbol und eine Relation repraesentieren
koennte, waeren sich die Menschen sicher nicht einig, ob die Relationen
richtig sind.
Die derzeitigen Visualisierungen verletzen oft die Regel 1 - gleiches am
gleichen Ort. Je nach Frage, Drehen und Wenden oder Bildschirmaufloesung
oder Fenstergroesse landen Ergebnisse an verschiedenen Plaetzen. Der
Suchaufwand in solchen semantischen Netzen ist meineerachtens fast immer
hoeher als in Textdarstellungen. Dachte ich jedenfalls. Seit wir in
unserem Thesaurus-Programm IC INDEX die 2-Visualiserung haben, sagen
einige, dass sie erst jetzt richtig verstehen, was ein Thesaurus ist.
Einige der Thesaurus-Entwickler malen sich erst ein Beziehungsgefuege hin,
bevor sie es im Textinterface eingeben. Die Studenten, die ich darin
unterrichtet habe, schauen sich fast alle nachdem die Begriffe eingegeben
und die Relationen festgelegt sind das Bild an - und nicht die
Listendarstellung. Das bedeutet: dass unsere Gehirne offensichtlich selbst
so kleine Dinge wie ein paar Begriffe und ihre semantisches Umfeld je nach
Repraesentation sehr unterschiedlich erkennen und verarbeiten.
Die Repraesentation von Objekten erscheint mir fast nicht loesbar
angesichts einer grenzlosen Menge. Doch auch bei den Relationen stoesst
man extrem schnell an Grenzen. Eine Weiterentwicklung von Thesauri sind
Ontologien - unterstuetzen mehr Relationen oder Relationstypen. Doch schon
hier landet man mit farbigen Strichen, verchiedenen Stricharten und
-dicken extrem schnell an Grenzen. 20 verschiedene Stricharten sind schon
viele zu viel. Ohne intensiven Einsatz von Beschriftung kommt man nicht
sehr weit.
Google hat mit seiner gezielt einfachen Oberflaeche meineserachtens
durchaus einen graischen Standard im Sinne von 1 gesetzt. Daran knuepfen
wir in unserem dandelon.com bewusst an, um moeglichst wenig neuen
Lernaufwand zu erzwingen und viele andere machen es gleich oder aehnlich.
In unserer seit einigen Wochen versteckten Visualisierung von
Thesaurusbegriffen und Relationen, sie kommt wieder, sobald wir mit den
geplanten Updates fertig sind, verletze ich zumindest teilweise die Regel
1, gerne haette ich alle Oberbegriffe oben und alle Unterbegriffe unten -
nur mit echten Daten passt das alles nicht mehr, unsere 25 Relationstypen
passen schlicht nicht optimal in den 2D-Raum (3D haben wir komplett
verworfen). Trial and Error ist noch lange angesagt - Reaktionen testen,
Eindruecke sammeln.
Visualisierung wird auch in Suchmaschinen sich irgendwann wohl
durchsetzen, derzeit sehe ich aber noch ueberhaupt kein Land in Bezug auf
eine hinreichend standardisierte, verstehbare, breit getragene
Repraesentatonsform. Ich rechne mit einer langen Migration in diese
Richtung.
Mit freundlichem Gruss
Manfred Hauer
AGI - Information Management Consultants
Dipl.-Inf.wiss. Manfred Hauer M.A.
Mandelring 238 b
67433 Neustadt / Weinstrasse
Germany
+49 (0) 6321 / 96 35 - 10
Manfred.Hauer@xxxxxxxxxx
Skype: Manfred Hauer
http://www.agi-imc.de
http://www.dandelon.com
Listeninformationen unter http://www.inetbib.de.