Seminar Mensch Maschine Kommunikation WS 01/02 - Universität ...
Seminar Mensch Maschine Kommunikation WS 01/02 - Universität ...
Seminar Mensch Maschine Kommunikation WS 01/02 - Universität ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Glyphen<br />
Symbole zur Visualisierung von mehreren<br />
Objekteigenschaften<br />
Version 09.04.20<strong>02</strong><br />
Anthea Merkle<br />
<strong>Seminar</strong> <strong>Mensch</strong>-Computer-Interaktion<br />
<strong>WS</strong> 20<strong>01</strong>/20<strong>02</strong><br />
<strong>Universität</strong> Konstanz<br />
FB Informatik und Informationswissenschaft
Inhalt<br />
1. Einleitung .............................................................................................................................................3<br />
2. Definition und Abgrenzung von verwandten Konzepten ............................................................4<br />
2.1. Definition ..........................................................................................................................................4<br />
2.2. Verwandte Begriffe ..........................................................................................................................4<br />
3. Historische Meilensteine ....................................................................................................................6<br />
3.1. Hieroglyphen und andere Bildschriften ........................................................................................6<br />
3.2. Bildstatistik nach “Wiener Methode”............................................................................................8<br />
4. Anwendungsgebiete von Glyphen..................................................................................................10<br />
5. Ausgewählte Praxisbeispiele ............................................................................................................10<br />
5.1. Chernoff-Faces ...............................................................................................................................10<br />
5.2. Shape Coding ..................................................................................................................................12<br />
5.3. Visualisierung von Dokumenten..................................................................................................13<br />
5.3.1. Envision ...................................................................................................................................13<br />
5.3.2. Visualisierung in digitalen Bibliotheken ..............................................................................15<br />
5.4. GeoVis .............................................................................................................................................17<br />
6. Aufbau und Entwicklung eines Glyphen.......................................................................................19<br />
6.1. Die Visualisierungspipeline...........................................................................................................19<br />
6.2. Kriterien zur Glyphenerstellung...................................................................................................21<br />
6.3. Glyphenerzeugung mit PS-Explore.............................................................................................21<br />
7. Andere Visualisierungsmöglichkeiten multidimensionaler Daten .............................................23<br />
7.1. Scatterplot-Matrizen.......................................................................................................................23<br />
7.2. Parallel Coordinates .......................................................................................................................24<br />
8. Entwicklung eigener Glyphen.........................................................................................................25<br />
9. Fazit.....................................................................................................................................................27<br />
10. Quellennachweis................................................................................................................................28<br />
10.1. Printmedien...................................................................................................................................28<br />
10.2. Online-Quellen .............................................................................................................................29<br />
10.3. Abbildungen..................................................................................................................................30<br />
2
1. Einleitung<br />
Der Begriff „Glyph“ ist mit unterschiedlichen Bedeutungen verbunden. Der Schwerpunkt dieser<br />
Arbeit behandelt Glyphen als Symbole zur Visualisierung von multivarianten Daten. Glyphen<br />
(oftmals – wenn auch nicht korrekt nach unserer Definition - auch als Ikonen, Bildstatistiken<br />
oder Piktogramme bezeichnet) sind demnach graphische Instanzen, die ein oder mehrere<br />
Datenwerte über Attribute wie Form, Größe, Farbe und Position übermitteln.<br />
Neben anderen graphischen Methoden werden sie zur Visualisierung von komplexen und<br />
multivarianten Daten und Informationen benutzt.<br />
Die Anwendbarkeit von Glyphen ist vielfältig, z.B. werden sie bei Geodaten eingesetzt, um bei<br />
Karten ortsbezogen verschiedene Merkmale zu visualisieren. Auch in der Statistik finden wir<br />
einige Beispiele für die Datenvisualisierung mit Glyphen. Beispiele für diese Art von Glyphen<br />
sind u.a. die Chernoff-Gesichter und das „Shape Coding“ nach Beddow.<br />
Die Visualisierung von komplexen Sachverhalten mittels Symbolen ist keine neuzeitliche<br />
Erfindung, in den urgeschichtlichen Bildschriften z.B. der Maya oder Ägypter finden wir die<br />
Vorläufer dieser Technik.<br />
Die Entwicklung eines Glyphen ist in eine „Visualisierungspipeline“ eingebunden. Anhand dieser<br />
wird die Entwicklung eines Glyphen in Teilprozesse aufgespalten, bei der zunächst die Daten<br />
aufbereitet werden, um sie dann nach bestimmten Kriterien auf den gewählten Glyphen<br />
abzubilden. Die Wahl des Glyphen, auf den die Daten abgebildet werden, spielt eine grosse Rolle<br />
für seine spätere Verwendung.<br />
Ein selbstentwickeltes Beispiel, in welchem multivariante Daten auf einen Glyphen abgebildet<br />
werden, soll dieses aufzeigen.<br />
Keywords: Glyph, Visualisierung, multivariante Daten<br />
1 Schumann 2000, S. 140<br />
3
2. Definition und Abgrenzung von verwandten Konzepten<br />
2.1. Definition<br />
Aus typographischer Sicht wird ein Glyph als „any graphic symbol not in the ASCII character set“ 2<br />
definiert. Ein simples Beispiel wäre der deutsche Umlaut „Ö“, welcher sich nach dieser<br />
Definition aus den Glyphen O und “ zusammensetzt.<br />
Um diese Definition allerdings allgemeingültig zu machen, müsste sie lauten: „any graphic symbol<br />
not in ANY international character set“. Also alle Zeichen, welche nicht im Alphabet einer Sprache zu<br />
finden sind.<br />
Im Griechischen hat das Wort „Glyph“ die Bedeutung Schnitzerei oder Skulptur. 3<br />
Im Bereich Informationsvisualisierung spricht man von einem Glyph als einer<br />
Visualisierungsprimitive, die exakt positioniert werden kann und Werte von Variablen in<br />
geometrische Charakteristika wie z.B. Länge, Winkel oder Form bzw. in Darstellungsattribute wie<br />
Farbe oder Transparenz verschlüsselt. Diese Definition wird in dieser Arbeit benutzt.<br />
2.2. Verwandte Begriffe<br />
Begriff Glyph wird in der Visualisierung auch manchmal als Ikone bezeichnet (nicht zu<br />
verwechseln mit dem User Interface-Ausdruck “Icon”). Nach Umberto Eco ist die Ikone ein<br />
Zeichen, das aufgrund einer Ähnlichkei und, aufgrund innerer Merkmale, die in irgendeiner Weise Merkmale des<br />
Gegenstandes korrespondieren, auf den bezeichneten Gegenstand verweist. Er grenzt dieses ab von Zeichen,<br />
welche in dem Maß ikonisch sind, wie es die Merkmale des von ihm Bezeichneten besitzt. Ikonisch sind also eine<br />
Fotographie, eine Zeichnung, ein Diagramm, aber auch eine logische Formel und insbesondere ein mentales Bild. 4<br />
Ein Icon ist ein kleines Piktogramm oder Symbol, das in Hypermedia-Programmen, Computer-<br />
Anwendungen oder graphischen Benutzerschnittstellen integriert ist. Icons sollen Objekte,<br />
Befehle, Anwendungen, Dateien o.ä. visualisieren und eventuell Operationen aktivieren.<br />
Ein Piktogramm, welches gerne als Synomym zu Icon benutzt wird, wird aber häufig im Bereich<br />
der „Infografik“ mit Glyph gleichgesetzt. Nach der hier angewendeten Definition eines<br />
Glyphen 5 , kann diesem nicht zugestimmt werden.<br />
Unter Piktogrammen versteht man einfache Bilder, die auf einen Blick ohne Vermittlung durch<br />
die Sprache einen Begriff aktivieren oder eine Handlung auslösen sollen.<br />
Ebenfalls wird der Begriff der Infografik häufig gleichgesetzt mit dem Begriff Glyph. Auch dieses<br />
stimmt mit der hier gewählten Definition von Glyphen nicht mit überein und muss klar<br />
abgegrenzt werden, denn die Infografik bildet die Wirklichkeit nicht direkt ab, sondern<br />
visualisiert abstrakte Vorgänge, die in der Regel nicht leicht verständlich sind, wenn man nur ein<br />
Abbild des Gegenstandes betrachtet. Der Begriff entstammt der Medien– und Werbebranche.<br />
Infografiken wurden schon in den 30er Jahren auf sehr „professionelle“ Weise zu<br />
Propagandazwecken eingesetzt. Mit diesen Grafiken sollte auch dem ungebildetsten Arbeiter<br />
klargemacht werden, in welcher Gefahr das Land sich befindet. Wie wir aus der Vergangenheit<br />
wissen, hat diese Botschaft funktioniert.<br />
2 http://www.its.bldrdoc.gov/projects/t1glossary2000/_glyph.html<br />
3 http://whatis.techtarget.com/definition/0,,sid9_gci212200,00.html<br />
4 Eco 1977, S. 60<br />
5 siehe 2.1 Definition<br />
4
Abbildung 1 – Antisemitistische Propaganda<br />
Ebenfalls aus den 30er Jahren stammt die Abbildung 2, welche ebenfalls dazu diente, weniger<br />
gebildeten wissenschaftliche Sachverhalte zu übermitteln. Diese Grafik ist schon mehr im Bereich<br />
der Glyphenvisualisierung als der der Infografiken anzusiedeln.<br />
Abbildung 2 – Vererbung der Minderwertigkeit<br />
5
3. Historische Meilensteine<br />
3.1. Hieroglyphen und andere Bildschriften<br />
Das Wort „Hieroglyphen“ stammt aus dem griechischem von hieros:heilig und glyphe:(in<br />
Stein)geritztes. Im Allgemeinen verbindet man mit Hieroglyphen fast ausschließlich die<br />
Schriftzeichen der alten Ägypter, aber auch die Schriften der Hethiter, Kreter und Maya werden<br />
heute Hieroglyphen genannt. Der einzige Zusammenhang zwischen diesen Sprachen besteht aber<br />
darin, dass sie Bildschriften hatten.<br />
Die Hieroglyphenschrift ist eine Bilderzeichenschrift und die älteste geschriebene Form von<br />
antiker Sprache. Trotz ihrer Bilderzeichenschrift sind die Hieroglyphen nicht primitiv. Sie<br />
formten ein völlig entwickeltes Schriftsystem, mit dem komplizierte semantische Informationen<br />
dargestellt werden konnten. 6<br />
Die Ägyptische Sprache setzte sich aus Ideogrammen (Begriffszeichen) und Phonogrammen<br />
zusammen. Phonogramme haben keinen Bezug zu den Begriffen, den sie darstellen, sondern nur<br />
zu ihrem Lautwert. Ein Zeichen kann in einem Satz ein Ideogramm sein, während es im nächsten<br />
ein Phonogramm ist. Meistens wurde in einer Mischung aus Phono- und Ideogrammen<br />
geschrieben. Durch Anfügen einiger Phonogrammen an ein Ideogramm kann dessen Bedeutung<br />
verändert werden. 7 So gesehen ist diese Schrift nicht weniger entwickelt als unser eigenes<br />
Alphabet.<br />
Die Mayaglyphe bestehen aus einer Mischung aus Symbolen und naturalistischen Bildern. Sie<br />
stellen Wortteile, Begriffe, Zahlen, Tage oder Monate dar. Ihre Glyphen können Logogramme<br />
(eine Glyphe steht für ein ganzes Wort oder einen Begriff) und Silben (für jede Glyphe ein<br />
Sprachlaut) darstellen.<br />
6 http://www.hieroglyphen.de/hiero_allg2.html<br />
7 http://www.kbs-koeln.de/gbg/information/vergangenh/hierogly/bastian.htm<br />
6
Abbildung 3 – Vereinfachtes Hieroglpyhen-Alphabet<br />
7
3.2. Bildstatistik nach “Wiener Methode”<br />
Otto Neurath, Ökonom und Philosoph, entwickelte Mitte der 20er Jahre die “Wiener Methode”<br />
der Bildstatistik für das neu gegründete Gesellschafts- und Wirtschaftsmuseum. Er sah in der<br />
Statistik den entscheidenden Faktor zur Beurteilung ökonomischer Zusammenhänge, gleichzeitig<br />
erkannte er, dass Zahlenkolonnen wenig attraktiv auf das heterogene Museumspublikum wirken<br />
würden. Bildtafeln sollten deshalb die abstrakten Zahlen massenwirksam präsentieren. Heute<br />
wird die “Wiener Methode” auch “Isotype” genannt.<br />
Abbildung 4 – Vergleich Tabelle / Grafik<br />
Diese Abbildung soll zeigen, das Tabellen und Formeln für die breite Masse meist schwer<br />
verständlich sind, da sie eine gewisse Vorbildung voraussetzen. Bildhafte Darstellungen hingegen<br />
können leichter verstanden werden.<br />
Im Wiener Museum entstanden zwischen 1925 und 1934 nicht nur Hunderte von Bildstatistiken.<br />
Museumsleiter Neurath formulierte auch die didaktischen Prinzipien: Isotype-Grafiken sollen<br />
immer anschaulich und gegenständlich sein sowie die Mengen korrekt visualisieren. Die Wiener<br />
Museumspädagogen sahen ihr wesentliches Anliegen darin, Gesellschaft und Ökonomie<br />
verständlich darzustellen. Die Grafik mußte also einfach sein und jeweils nur ein ausgewähltes<br />
Thema veranschaulichen. Handelte es sich dabei um Zahlen, so bestand der erste didaktische<br />
Kunstgriff – ähnlich wie in der Mengenlehre – darin, sich von den exakten Werten abzuwenden<br />
und sich den dahinter verborgenen Beziehungen und Verhältnissen zuzuwenden. Nicht<br />
lückenloses Wissen, das nur Fachwissenschaftler interessiert, sondern größere Zusammenhänge<br />
in überschaubaren Einheiten sollten präsentiert werden. Ihre Bildstatistiken zeigen deshalb statt<br />
spröder Zahlen anschauliche Mengenverhältnisse.<br />
Zweitens verwendete man gegenständliche Symbole zur Mengendarstellung, um es dem<br />
Betrachter leicht zu machen, sich sowohl an den Gegenstand als auch an die Verhältnisse visuell<br />
zu erinnern.<br />
8
Und drittens wurden in Isotype-Grafiken größere Mengen stets durch eine größere Anzahl von<br />
Symbolen und nicht durch größere Symbole wiedergeben. Diese Darstellung erleichtert zum<br />
einen den korrekten Mengenvergleich, zum anderen liefert sie auch logisch meistens das richtige<br />
Bild, nämlich dann, wenn es sich um eine wachsende Anzahl und nicht um größer werdende<br />
Gegenstände handelt.<br />
Die gegenständliche Mengendarstellung erforderte einen umfangreichen Symbolvorrat. Dem<br />
Grafiker Arntz, der seit 1929 zum Museumsteam gehörte, gelang es, die anspruchsvollen Inhalte<br />
bildlich adäquat umzusetzen. 8<br />
8 Jansen 1999, S. 39<br />
9
4. Anwendungsgebiete von Glyphen<br />
Die Visualisierungstechnik von Glyphen, mittels einer Grafik auf einfache und<br />
allgemeinverständliche Weise komplexe Sachverhalte darzustellen, kann in den verschiedensten<br />
Bereichen angewandt werden.<br />
Beispiele wären:<br />
� Kartographie (z.B. Visualisierungsunterstützung von Geodaten)<br />
� Graph Drawing (statt Diagrammen)<br />
� Interface Design (Icons, Piktogramme)<br />
� Katastrophen- und andere Warnsysteme<br />
� Data Mining Visualisierung<br />
� Statistik<br />
� Marketing und Werbung<br />
� Kognitive Psychologie<br />
5. Ausgewählte Praxisbeispiele<br />
5.1. Chernoff-Faces<br />
Die von Herman Chernoff 1973 entwickelten Chernoff-Glyphen sind eines der bekanntesten<br />
Beispiele von Glyphen. Die oft auch als Chernoff-Faces oder zu deutsch Chernoff-Gesichter<br />
bezeichneten Glyphen sind mit die ersten Glyphen, die zur Visualisierung von Multiparameter-<br />
Daten eingesetzt wurden. Sie nutzen die beim <strong>Mensch</strong>en besonders geschulten Fähigkeiten zum<br />
Erkennen von Nuancen und Veränderungen in Gesichtsmimiken aus und kommen in<br />
verschiedenen Statistik- und Visualisierungstools zum Einsatz. 9<br />
Abbildung 5 – Beispiel einer Darstellung von Chernoff-Faces<br />
Chernoff verwendete diese Technik ursprünglich am Beispiel von Geodaten, welche<br />
charakterisiert nach verschiedenen Attributen (z.B. Salzgehalt, Wassergehalt), dargestellt wurden.<br />
Mit dieser Visualisierungstechnik konnte er bis zu 18 verschiedene Merkmale mittels<br />
Unterscheidung in Form und Größe des Kopfes, der Nase, der Augen und Brauen und des<br />
Mundes darstellen.<br />
9 Schumann 2000, S. 194<br />
10
Eine Variante der klassischen Chernoff-Faces stellt das untenstehende Beispiel dar. Sie besteht<br />
darin, von bekannten Bildern auszugehen, zum Beispiel von Mona Lisa. Diese Bilder werden<br />
parametrisiert und anschließend entsprechend der Merkmalsausprägung einer gegebenen<br />
Datenmenge verzerrt.<br />
Abbildung 6 – Chernoff-Variante „Mona Lisa“<br />
Mittels der unterschiedlichen Gesichtsausdrücke der Mona Lisa sollen Eigenschaften (neutral,<br />
good economics, many recreational facilities, high crime rate, bad healthcare situtation)<br />
ausgewählter amerikanischer Städte dargestellt werden. 10<br />
10 Schumann 2000, S. 198<br />
11
5.2. Shape Coding<br />
Die von J. Beddow 1990 entwickelte Glyphenvisualisierung des Shape Coding wird auch als<br />
Autoglyph bezeichnet und ist ein Spezialfall der Farbikone. 11 Der Glyph besteht aus einem<br />
achsenparallelem Rechteck, das mit einem regelmäßigen Gitter überzogen ist. Jeder Gitterzelle<br />
wird genau ein Merkmal zugeordnet. Die Ausprägung des Merkmals wird in der Farbe der<br />
entsprechenden Gitterzelle verschlüsselt.<br />
Abbildung 7 – Shape Coding Rechteck<br />
Die Shape-Coding-Technik eignet sich besonders für nominale Merkmale mit einem begrenzten<br />
Wertebereich, insbesondere für binäre Merkmale. Ansonsten bieten sich Klasseneinteilungen an<br />
(z.B. in hohe, niedrige und mittlere Werte), damit die Darstellung interpretierbar bleibt.<br />
Abbildung 8 – Shape Coding Matrix eines mikrobiologischen Datensatzes<br />
Ursprünglich wurde die Shape-Coding-Technik entwickelt, um Korrelationen bei einer großen<br />
Anzahl von Variablen zu studieren. Die Muster, die durch die Attributierung des Autoglyphen<br />
entsprechend der gegebenen Datenwerte entstehen, können spontan wahrgenommen und<br />
unterschieden werden. Damit lassen sich Korrelationen intuitiv erkennen. Die Wahrnehmung<br />
von Korrelationen kann zudem verbessert werden, wenn korrelierende Variable in benachbarten<br />
Feldern des Autoglyphen angeordnet sind. 12<br />
11 Levkowitz 1991<br />
12 Schumann 2000, S. 196<br />
12
5.3. Visualisierung von Dokumenten<br />
5.3.1. Envision<br />
Die „Envision Digital Library“ wurde als Prototyp der digitale Bibliothek für Informatik am<br />
Virginia Tech mit Unterstützung des ACM und NSF Grant Iri-9116991 entwickelt. Ungefähr<br />
200.000 Dokumente, meistens von den ACM-Publikationen, wurden in SGML umgewandelt und<br />
in das MARIAN-DL-Suchsystem geladen. Der größte Teil der Dokumente bestand nur aus<br />
Metadaten, häufig mit Auszügen, aber auch aus einigen Volltextdokumenten. Auch einige<br />
Multimedia-Dokumente waren enthalten.<br />
Der innovative Teil des Projektes ist jedoch die Visualisierung von Envision. Die Suchresultate<br />
werden als Glyphenmatrix angezeigt, welche semantisch vom Benutzer veränderbar ist.<br />
In einem Teil des Fensters hat der Benutzer Zugriff auf bibliographischen Informationen.<br />
Während viele Visualisierungssschnittstellen für Information Retrieval Systeme<br />
Dokumentanfragen bildlich ähnlich geordnet darstellen, stellt Envison graphisch eine Vielzahl<br />
von Dokumenteigenschaften dar und unterstützt eine umfangreiche Benutzersteuerung. 13<br />
Abbildung 9 – Envision Übersichtsfenster<br />
In einem Teil des Fensters hat der Benutzer Zugriff auf bibliographischen Informationen.<br />
Während viele Visualisierungssschnittstellen für Information Retrieval Systeme<br />
Dokumentanfragen bildlich ähnlich geordnet darstellen, stellt Envison graphisch eine Vielzahl<br />
von Dokumenteigenschaften dar und unterstützt eine umfangreiche Benutzersteuerung. 14<br />
13 http://www.dlib.vt.edu/projects/Envision/<br />
14 http://www.dlib.vt.edu/projects/Envision/<br />
13
Das in Abbildung 9 gezeigte Envision Result Window besteht aus drei interaktiven Fenstern:<br />
� ein kleines Abfragefenster, indem der Benutzer Zugriff auf ein editierbares<br />
Formular für die Anzeige der Abfrage auf dem Bildschirm hat<br />
� ein scrollbares graphisches Ansichtsfenster, welches mit Glyphen die Resultate<br />
der Anfrage darstellt<br />
� ein Fenster, in dem die bibliographischen Information über die ausgewählten<br />
Dokumente graphisch dargestellt werden<br />
Abbildung 10 – Envision Result Fenster<br />
Das Layout des graphischen Ansichtfenster, ist an einem Scatterplot orientiert. Jedes gefundene<br />
Dokument wird als Glyph dargestellt. Eine Legende erläutert dem Benutzer die aktuell<br />
angewandte Semantik und bietet ihm gleichzeitig auch die Möglichkeit, diese abzuändern.<br />
Der Benutzer hat verschiedene Symbole, Attribute oder graphische Einstellmöglichkeiten zur<br />
Verfügung:<br />
� Glyphenpositionierung entlang der X- und Y-Achse<br />
� Glyphengröße<br />
� Glyphenfarbe (oder den Sättigungsgrad bei schwarz-weiß Monitoren)<br />
� die Form des Glyphen<br />
� der alphanummerische Zeichensatz jedes Symbols 15<br />
Durch Farb- und Formgebung erkennt der Benutzer des Systems auf einen Blick, ob das<br />
Dokument für ihn relevant ist oder nicht.<br />
15 http://www.dlib.vt.edu/projects/Envision/CS5604Proj99/Adv-Envision.html<br />
14
5.3.2. Visualisierung in digitalen Bibliotheken<br />
Ein weiteres Beispiel, wie Dokumente in Retrieval Systemen visuell dargestellt werden können,<br />
haben Kate Beard und Vyjayanti Sharma ausgearbeitet.<br />
Ihr Ziel war es auch, den Anfragenden eine möglichst einfach verständliche Darstellung der<br />
Relevanz der gefundenen Dokumente zu ermöglichen. Das Ranking wurde in einem 3-teiligen<br />
Glyphen umgesetzt. Die Marke an der Unterseite des Glyphen kennzeichnet die Datei. 16<br />
Diese graphische Lösung hat einige Vorteile. Zuerst vermeidet sie eine bedeutungslose<br />
mathematische Kombination der unterschiedlichen Attribute. Zweitens kann der menschliche<br />
Sinnenapparat den Glyphen als eine graphische Maßeinheit leicht verarbeiten und doch die<br />
einzelnen Ränge noch sichtlich trennen.<br />
Jedes der drei Teile des Glyphen kann durch eine andere Farbe dargestellt werden. Weiß bedeutet<br />
in allen Fällen, das kein Wert vorhanden ist. Die einzelnen Ränge können mit Sättigung angezeigt<br />
werden. 17<br />
Abbildung 11 – 3-teiliger Glyph mit Ranking Schema<br />
Wie in Abbildung 12 dargestellt, können auch mehrere Glyphen simultan angeordnet auf dem<br />
Bildschirm angezeigt werden. In Verbindung mit einer Karte erhält der Benutzer schnell einen<br />
Gesamteindruck des Ergebnisses seiner Anfrage.<br />
16 Beard 1995, S. 158<br />
17 Beard 1995, S. 158<br />
15
Abbildung 12 - Glyphenkombination<br />
16
5.4. GeoVis<br />
Zum besseren Verständnis der Entstehung von nächtlichen Hang- und Talwinden hat das<br />
Institut für GeoInformatik in Münster das Simulationsmodell S_KIMO 3 entwickelt. Dabei<br />
werden 12 verschiedene Datentypen zu verschiedenen Zeitpunkten simuliert. Diese<br />
Informationen sind als Rasterdaten verhanden und präsentieren 17 Schichten über dem Gelände.<br />
Diese Daten werden in einem dreidimensionalen Raum visualisiert, durch den eine frei zu<br />
definierende Flugbahn gewählt werden kann.<br />
Die Verwendung von dreidimensionalen Glyphen ist ein Ansatz, einige Datentypen auf einmal<br />
darzustellen. Die hier verwendeten Glyphen kann man als dreidimensionale Pfeilspitzen ansehen,<br />
die Daten des Raumquaders präsentieren, in dem sie erscheinen. Die Richtung, in die sie zeigen,<br />
ist die resultierende Windrichtung. Nun kann man wählen, welchen Datensatz die Ausdehnung<br />
dieses Glyphen in der jeweiligen Raumdimension hat. Für die Farbe und Transparenz kann man<br />
in beiden Darstellungsarten einen Datentyp frei wählen, somit kann ein Glyph insgesamt 5 (+<br />
resultierende Windrichtung) Datentypen und eine Oberfläche 3 Datentypen anzeigen. Die<br />
Zeitdynamik wird dadurch erreicht, daß sich die Daten dem jeweiligen Zeitraum anpassen, also<br />
durch eine Animation über die Zeit.<br />
Abbildung 13 – GeoVis Bildschirmansicht 1<br />
17
Abbildung 14 – GeoVis Bildschirmansicht 2<br />
In Abbildung 13 und 14 werden zusätzlich zu den Landnutzungs-, Gebäude und Höhendaten die<br />
absolute Temperatur (die Farbe der Glyphen bzw. Oberflächen), die gesamte resultierende<br />
Windstärke (jede der Glyphdimensionen bzw. die Höhe der Oberfläche) und die relative Feuchte<br />
(Transparenz) dargestellt.<br />
Mit Hilfe dieser Visualisierung erkennt man schnell Zusammenhänge zwischen den einzelnen<br />
Datentypen, auch fallen extreme Datenwerte auf. Bei der Zeitanimation versteht man schnell die<br />
Dynamik der Daten, der Flug durch die Landschaft hilft beim Betrachten von Details. Das<br />
Programm muß noch in der Anwendung evaluiert werden. Mögliche Weiterentwicklungen sind<br />
ein anderer Glyph, verstärkter Einsatz von Detail und Kontext sowie eine echte<br />
Datenminimierung, um die Performance der Darstellung zu verbessern. 18<br />
18 http://www.uni-paderborn.de/fachbereich/AG/agdomik/diplomarbeiten/mking/da3.html<br />
18
6. Aufbau und Entwicklung eines Glyphen<br />
6.1. Die Visualisierungspipeline<br />
Der Visualisierungsprozess der Daten auf ein Glyphenmodell ist wie auch bei anderen<br />
Visualisierungsmethoden mit bestimmten Einzelschritten verknüpft. Anhand einer<br />
Visualisierungspipeline sollen diese verdeutlicht werden. 19<br />
Filtering Datenauswahl Mapping Rendering<br />
Evaluierung Auswahl von Abbildung der Erzeugung<br />
der Daten - Datensätzen Datenwerte auf der Bilder<br />
Bearbeitung - Beobachtungsfällen abstrakte<br />
der Daten - Variablen geometrische<br />
- Selektion von Primitive und<br />
Wertebereichs- ihre Attribute<br />
eigenschaften<br />
Daten Bild<br />
Die Abbildung zeigt die vier wesentlichen Schritte der Visualisierungspipeline: Die<br />
Datenaufbereitung (Filtering), die Datenauswahl, die Erzeugung eines Geometriemodells<br />
(Mapping) und die Bildgenerierung (Rendering).<br />
Die Datenaufbereitung realisiert eine Daten-zu-Daten-Abbildung. Ausgangspunkt sind die in<br />
einer Anwendung erhobenen Daten, auch als Rohdaten bezeichnet. Diese werden für die<br />
nachfolgenden Visualisierungsschritte aufbereitet. Dazu gehören z.B. Operationen zur<br />
Vervollständigung oder Reduzierung einer Datenmenge. 20<br />
Eine weitere wichtige Aufgabe der Datenaufbereitung ist das Filtern der Daten. Hierauf ist auch<br />
die englische Bezeichnung „Filtering“ zur Benennung des Schrittes der Datenaufbereitung<br />
zurückzuführen. Durch das Filtern lassen sich Datenwerte glätten, eventuelle Fehler korrigieren<br />
oder Werte nach bestimmten Kriterien extrahieren, z.B. durch Anwendung von<br />
Schwellwertoperationen. Im Ergebnis der Datenaufbereitung liegen die so bezeichneten<br />
aufbereiteten Daten vor.<br />
Bei multivarianten Daten ist eine anschließende Auswahl der Daten nach bestimmten Kriterien<br />
nötig, z.B. welche Wertebereiche dargestellt werden sollen oder ob nur bestimmte<br />
Beobachtungsfälle visualisiert werden sollen.<br />
Der anschließende Mapping-Schritt ist das Kernstück des Visualisierungsprozesses.<br />
Ausgangspunkt sind die aufbereiteten Daten. Diese können geometrischer und nichtgeometrischer<br />
Natur sein. Die nicht-geometrischen Daten werden vom Mapping-Schritt in<br />
Geometriedaten überführt, d.h. es wird eine Daten-zu-Geometrie-Abbildung realisiert.<br />
Beim Mapping wird in entscheidendem Maße Einfluss auf die spätere visuelle Repräsentation der<br />
Daten genommen. Hier wird entschieden, welche geometrischen Primitive erzeugt und mit<br />
welchen Attributen (z.B. Farbe, Größe) sie belegt werden sollen.<br />
19 nach Haber 1990<br />
20 Schumann 2000, S. 15 ff<br />
19
Der letzte Schritt der Visualisierungspipeline ist die Bildgenerierung (Rendering). Hier erfolgt die<br />
Abbildung der Geometriedaten in Bilddaten.<br />
Aus der Sicht des Datenflusses stellt die Visualisierungspipeline wie folgt dar:<br />
Rohdaten aufbereitete Geometrie- Bilddaten<br />
Daten daten<br />
In folgender Abbildung soll der Visualisierungsprozeß an einem Beispiel gezeigt werden:<br />
Abbildung 15 – Visualisierungsprozeß<br />
Die Rohdaten werden an den rot gezeichneten Punkten erfasst.<br />
Die Daten werden aufbereitet und vorverarbeitet, damit ihre Struktur der gewählten Form des<br />
Glyphen angepasst werden kann.<br />
Die Datenwerte werden gemappt und auf das Gitter projiziert. Der Datenwert „Druck“ wird auf<br />
die Höhe, der Datenwert „Temperatur“ wird auf die Farbe des Glyphen abgebildet.<br />
20
6.2. Kriterien zur Glyphenerstellung<br />
Üblicherweise werden die Werte eines Datensatzes in einer Glyphe zusammengefasst. Ein nicht<br />
triviales Problem ist das Entwickeln eines effektiven geometrischer Kodes zur Konstruktion der<br />
Glyphen. Hierfür lassen sich einige Regeln angeben: 21<br />
die einzelnen Merkmale sollten in einer Glyphe gut kombinierbar und unterscheidbar sein<br />
Glyphen sollten separat erkennbar sein<br />
Glyphen sollten sich erkennbar unterscheiden, wenn die zugehörigen Merkmalsausprägungen<br />
differieren<br />
Glyphen sollten vom Betrachter interpretierbar sein<br />
6.3. Glyphenerzeugung mit PS-Explore<br />
Das Statistiktool PS-Explore bietet neben anderen Funktionalitäten auch die Visualisierung<br />
mittels Glyphen an.<br />
Die Glyph-Prozedur in PS-Explore ist mit einer Ähnlichkeitssortierung gekoppelt, wie sie etwa<br />
auch in der Matrixanalyse benutzt wird. Somit ist es möglich, den in die Analyse einbezogenen<br />
Einzelfällen Gruppen von Fällen zuzuordnen, die hinsichtlich der Analysemerkmale<br />
Gemeinsamkeiten aufweisen.<br />
Es ist auch möglich, von vorneherein eine Gruppenvariable festzulegen. Die einzelnen Glyphen<br />
werden dann entsprechend ihrer Gruppenzugehörigkeit farblich differenziert.<br />
Abbildung 16 – Glyphenerstellung mit PS-Explore<br />
21 Schumann 2000, S. 192<br />
21
Üblich sind zwei Variationen der Glyphendarstellung. Im ersten Fall sind die Strecken<br />
proportional zu den jeweiligen Merkmalswerten (wobei diese natürlich positiv sein müssen). Im<br />
zweiten Fall werden alle Werte einer Datenmatrix (alle Werte aller Merkmale und aller Objekte)<br />
in drei Teile aufgespalten. Die Werte des unteren (kleinsten) Drittels werden durch Punkte auf<br />
der Kreislinie, die Werte des mittleren Drittels als Strecken fester Länge c und die Werte im<br />
oberen Drittel durch Strecken der Länge 2c kodiert. 22<br />
Letztere Darstellungsart ist speziell dann sinnvoll, wenn die verschiedenen Objekte kontrastiert<br />
werden sollen, um spezifische Unterschiede besser hervorzuheben. 23<br />
Abbildung 17 – Glyphendarstellung mit PS-Explore<br />
Die in Abbildung 17 dargestellte Glyphenvisualisierung soll die Zufriedenheit der Patienten eines<br />
Krankenhauses visualisieren. Die einzelnen evaluierten Kriterien 24 werden anhand der „Haare“<br />
des Glyphen dargestellt. Je länger das Haar desto zufriedener waren die Patienten mit der<br />
jeweiligen Leistung. Dem „Kopf“ des Glyphen kommt keine Bedeutung zu, er dient lediglich als<br />
Grundlage und um dem Glyphen ein „Bild“ zu geben.<br />
22 http://www.ps-explore.de/html/glyphen_0.html<br />
23 http://www.ps-exlore.de/html/glyphen_0.html<br />
24 wie in der Legende rechts in Abbildung 17 dargestellt<br />
22
7. Andere Visualisierungsmöglichkeiten multidimensionaler Daten<br />
7.1. Scatterplot-Matrizen<br />
Beim Scatterplot wird jeder Datenwert als Punkt in einem kartesischen Koordinatensystem<br />
eingezeichnet. Bei dreidimensionalen Scatterplots sind die Daten als Punktwolke über einem<br />
Achsenkreuz im Raum verstreut.<br />
Abbildung 18 – Scatterplot-Matrix<br />
Wie in Abbildung 18 dargestellt, können auch mehrere Scatterplots zusammen in einer<br />
sogenannten Scatterplotmatrix dargestellt werden. Diese Technik ist sehr nützlich wenn mit Hilfe<br />
von mehreren Datenproben gewisse Tendenzen nachgewiesen werden sollen. Die Brauchbarkeit<br />
dieser Technik verringert sich mit 8 oder mehr Dimensionen. 25<br />
25 http://mvc.man.ac.uk/students/summer95/ieuan/MultidimVis/Ohp_6.html<br />
23
7.2. Parallel Coordinates<br />
Diese Technik projiziert eine n-dimensionale Darstellung auf eine 2D-Fläche, indem sie jede<br />
Dimension an der Y-Achse ausrichtet, gleichzeitig die Intervalle auf der X-Achse abbildet.<br />
Abbildung 19 – Parallel Coordinates<br />
Auch in der Abbildung 19 werden die Merkmale Zylinderanzahl, PS, Gewicht und<br />
Beschleunigung eines Fahrzeugs abgebildet.<br />
Diese Technik kann verwendet werden, um Wechselbeziehungen der Datensätze hervorzuheben.<br />
Mit Erhöhung der darzustellenden Daten verschlechtert sich allerdings die Qualität der Grafik.<br />
24
8. Entwicklung eigener Glyphen<br />
Viele glyphbasierte Visualisierungen basieren auf dem stick figure icon.<br />
Das stick figure icon besteht aus fünf verbundenen Segmenten, den Gliedern. Ein weiteres<br />
Segment, der Körper, dient als Basis für die verschiedenen geometrischen Transformationen.<br />
Jedes Glied hat drei Parameter, in denen die Daten abgebildet werden können: der Winkel, die<br />
Intensität und die Länge. 26<br />
Abbildung 20 – Grundgerüst Stick figure icon<br />
Angelehnt an die stick figure icon wurde ein Modell entwickelt, bei dem fünf Personenmerkmale auf<br />
eine Glyphe abgebildet werden sollen.<br />
Merkmal Ausprägung<br />
Geschlecht �<br />
Weiblich<br />
Bildungsstand<br />
Einkommen<br />
Familienstand<br />
Besitzstand<br />
Hoch<br />
Hoch<br />
single<br />
Immobilieneigentümer<br />
Mittel<br />
Mittel<br />
26 http://www.cs.uml.edu/~fjara/thesis/active/proposal/node6.html<br />
25<br />
�<br />
Männlich<br />
liiert<br />
Mieter<br />
Niedrig<br />
Niedrig
Beispiele:<br />
Weiblich, mit hohem Bildungsstand, hohem<br />
Einkommen, Single und zur Miete wohnend.<br />
Männlich, mittlerer Bildungsstand, mittleres<br />
Einkommen, nicht Single, in eigenem Haus /<br />
Wohnung wohnend.<br />
Durch die Anordnung der fertigen Glyphen auf einer Karte oder einen könnte noch das Merkmal<br />
„geographische Lage“ dazukommen. Bei einer chronologischen Entwicklung könnten die<br />
Glyphen auch auf einem Zeitstrahl angeordnet sein.<br />
26
9. Fazit<br />
Glyphen werden in den unterschiedlichsten Bereichen der Datenvisualisierung eingesetzt.<br />
Gemeinsam haben all die vorgestellten Beispiele, dass durch den Einsatz von Glyphen die<br />
Sachverhalte allgemeinverständlich dargestellt werden sollen, sozusagen „auf einen Blick“<br />
erkennbar.<br />
Durch eine geeignete Wahl in der Form und Art des Glyphen kann dies z.B. mittels<br />
Musterbildung auch erreicht werden. Wichtig ist es, die Zielgruppe der Benutzer dabei zu<br />
beachten, damit der erzeugte Glyph auch im richtigen Kontext dargestellt wird.<br />
Im Vergleich zu den anderen erwähnten Visualisierungsmethoden – dem Scatterplot und den<br />
Parallel Coordinates – sind Glyphen auch ohne Vorbildung verständlich, allerdings kommen die<br />
wenigsten Glyphen ohne eine Legende aus. Dies wird vor allem bei den Chernoff-Faces deutlich.<br />
Klar muss auch abgrenzt werden, wann der Einsatz einer Glyphenvisualisierung der<br />
Tabellendarstellung vorzuziehen ist. Der Nutzen und die Sinnhaftigkeit sollte gut abgewägt<br />
werden, denn einige Glyphenvisualisierung bringen keinen Mehrwert, sondern sind nur für die<br />
„schöne Optik“ erstellt worden – eher eine Spielerei. Im gezeigten Beispiel von PS-Explore wäre<br />
eine Tabellenauflistung wohl besser geeignet.<br />
Auch sind nicht alle Glyphen für die Visualisierung von multivarianten Daten geeignet, wie man<br />
an dem Beispiel des Autoglyphen nach Beddow sieht.<br />
Aber gerade neuere Entwicklungen auf dem Bereich der Glyphenvisualisierung machen sich die<br />
menschliche Eigenschaft des Bilderkennens zu Nutze, um multivariante Daten mittels Glyphen<br />
zu präsentieren. Und dies ist auch vonnöten.<br />
Gerade durch den Boom in den neuen Medien (wie z.B. dem Internet oder CD-ROMs) haben<br />
mittlerweile nicht nur höher- oder fachgebildete <strong>Mensch</strong>en leichten Zugang zu Informationen.<br />
Durch den Einsatz von Glyphenvisualisierung kann das Informationsverständnis erheblich<br />
gefördert und verbessert werden.<br />
27
10. Quellennachweis<br />
10.1. Printmedien<br />
Beard, Kate / Sharma, Vyjayanti:<br />
Multidimensional ranking for data in digital spatial libraries. Special issue of Metadata.<br />
Journal of Digital Libraries Vol.1 No.1 pp 153 –160, 1995<br />
Beddow, Jeff:<br />
Shape coding of multidimensional data on a microcomputer display.<br />
Proceedings of IEEE Visualization '90, pages 238--246, Los Alamitos, CA., 1990. IEEE<br />
Computer Society Press.<br />
Eco, Umberto:<br />
Zeichen: Einführung in einen Begriff und seine Geschichte<br />
Frankfurt : Suhrkamp, 1977<br />
Haber, Robert B. / McNabb, D.A.:<br />
Visualization Idioms: A Conceptual Model for Scientific Visualization Systems<br />
In Visualization in Scientific Computing, G. M. Nielson, B. Shriver and L.J. Rosenblum (eds),<br />
IEEE Computer Society Press, 1990<br />
Hauptsache gesund! : Gesundheitsaufklärung zwischen Disziplinierung und Emanzipation [eine<br />
Ausstellung des Deutschen Hygiene-Museums Dresden und der Bundeszentrale für<br />
gesundheitliche Aufklärung Köln]<br />
Marburg : Jonas Verl., 1998<br />
Jansen, Angela / Scharfe, Wolfgang:<br />
Handbuch der Infografik: Visuelle Information in Publizistik, Werbung und Öffentlichkeitsarbeit<br />
Berlin [u.a.] : Springer, 1999<br />
Levkowitz, Haim:<br />
Color Icons: Merging Color and Texture Perception for Integrated Visualization of Multiple<br />
Parameters.<br />
Proceedings Visualization `91, IEEE Computer Society Press, Los Alamitos, 1991, S. 164 - 170<br />
Meyer, Jörn-Axel:<br />
Visualisierung im Management<br />
Wiesbaden : Dt. Univ.-Verl., 1996<br />
Schumann, Heidrun:<br />
Visualisierung: Grundlagen und allgemeine Methoden<br />
Berlin [u.a.] : Springer, 2000<br />
28
10.2. Online-Quellen<br />
Glyphenvisualisierung mit PS-Explore<br />
http://www.ps-explore.de/html/glyphen_0.html<br />
Matthias König:<br />
Landschaftsflug als dynamische Präsentation mehrdimensionaler Geodaten, Diplomarbeit im<br />
Fach Informatik - Computergraphik/Visualisierung<br />
http://www.uni-paderborn.de/fachbereich/AG/agdomik/diplomarbeiten/mking/da3.html<br />
Hierogyphen<br />
http://www.hieroglyphen.de/hiero_allg2.html<br />
http://www.kbs-koeln.de/gbg/information/vergangenh/hierogly/bastian.htm<br />
Scatterplot<br />
http://mvc.man.ac.uk/students/summer95/ieuan/MultidimVis/Ohp_6.html<br />
Parallel Coordinates<br />
http://mvc.man.ac.uk/students/summer95/ieuan/MultidimVis/Ohp_5.html<br />
Definition Glyph<br />
http://www.its.bldrdoc.gov/projects/t1glossary2000/_glyph.html<br />
Definition Glyph<br />
http://whatis.techtarget.com/definition/0,,sid9_gci212200,00.html<br />
Envision Digital Library Project<br />
http://www.dlib.vt.edu/projects/Envision/<br />
http://www.dlib.vt.edu/projects/Envision/CS5604Proj99/Adv-Envision.html<br />
Stick figure icon<br />
http://www.cs.uml.edu/~fjara/thesis/active/proposal/node6.html<br />
29
10.3. Abbildungen<br />
Abbildung 1 – Antisemitistische Propaganda<br />
Handbuch der Infografik - CD-Beilage<br />
Abbildung 2 - Vererbung der Minderwertigkeit<br />
Hauptsache gesund!, S. 44<br />
Abbildung 3 - Vereinfachtes Hieroglyphen-Alphabet<br />
http://wvw.kbs-koeln.de/gbg/information/vergangenh/hierogly/h2.htm<br />
Abbildung 4 - Vergleich Tabelle / Statistik<br />
Abbildung 5 – Beispiel einer Darstellung von Chernoff-Faces<br />
Abbildung 6 – Chernoff-Variante „Mona Lisa“<br />
Schumann 2000, S. 198<br />
Abbildung 7 – Shape Coding Rechteck<br />
Schumann 2000, S. 196<br />
Abbildung 8 – Shape Coding Matrix<br />
Schumann 2000, S. 196<br />
Abbildung 9 – Envision Übersichtsfenster<br />
http://www.dlib.vt.edu/projects/Envision/<br />
Abbildung 10 – Envision Result Fenster<br />
http://www.dlib.vt.edu/projects/Envision/GV2.pdf<br />
Abbildung 11 – 3-teiliger Glyph mit Ranking Schema<br />
Beard 1995, S. 158<br />
Abbildung 12 - Glyphenkombination<br />
Beard 1995, S. 159<br />
Abbildung 13 – GeoVis Bildschirmansicht 1<br />
http://www.uni-paderborn.de/fachbereich/AG/agdomik/diplomarbeiten/mking/da3.html<br />
Abbildung 14 – GeoVis Bildschirmansicht 2<br />
http://www.uni-paderborn.de/fachbereich/AG/agdomik/diplomarbeiten/mking/da3.html<br />
Abbildung 15 – Visualisierungsprozeß<br />
Schumann 2000, S. 16<br />
Abbildung 16 – Glyphenerstellung mit PS-Explore<br />
http://www.ps-explore.de/html/glyphen_0.html<br />
Abbildung 17 – Glyphendarstellung mit PS-Explore<br />
http://www.ps-explore.de/html/glyphen_0.html<br />
30
Abbildung 18 – Scatterplot-Matrix<br />
http://mvc.man.ac.uk/students/summer95/ieuan/MultidimVis/Ohp_6.html<br />
Abbildung 19 – Parallel Coordinates<br />
http://mvc.man.ac.uk/students/summer95/ieuan/MultidimVis/Ohp_5.html<br />
Abbildung 20 – Grundgerüst Stick figure icon<br />
http://www.cs.uml.edu/~fjara/thesis/active/proposal/node6.html<br />
31