Please use this identifier to cite or link to this item: http://dx.doi.org/10.18419/opus-6433
Authors: Heinrich, Julian
Title: Visualization techniques for parallel coordinates
Other Titles: Visualisierungstechniken für parallele Koordinaten
Issue Date: 2013
metadata.ubs.publikation.typ: Dissertation
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-85288
http://elib.uni-stuttgart.de/handle/11682/6450
http://dx.doi.org/10.18419/opus-6433
Abstract: Visualization plays a key role in knowledge discovery, visual data exploration, and visual analytics. Static images are an effective tool for visual communication, summarization, and pattern extraction in large and complex datasets. Only together with human-computer-interaction techniques, visual interfaces enable an analyst to explore large information spaces and to drive the whole analytical reasoning process. Scatterplots and parallel coordinates are well-recognized visualization techniques that are commonly employed for statistics (both explorative and descriptive) and data-mining, but are also gaining importance for scientific visualization. While scatterplots are restricted to the display of at most three dimensions due to the orthogonal layout of coordinate axes, a parallel arrangement allows for the visualization of multiple attributes of a dataset. Although both techniques rely on projections of higher-dimensional geometry and are related by a point–line duality, parallel coordinates enjoy great popularity for the visualization and analysis of multivariate data. Despite their popularity, parallel coordinates are subject to a number of limitations that remain to be solved. For large datasets, the potentially high amount of overlapping lines may hinder the observer from visually extracting meaningful patterns. Encoding observations with polylines make it difficult to follow lines over all dimensions, as they lose visual continuation across the axes. Clusters cannot be represented by the geometry of lines, and the order of axes has a high impact on the patterns exhibited by parallel coordinates. This thesis presents visualization techniques for parallel coordinates that address these limitations. As a foundation, an extensive review of the state of the art of parallel coordinates will be given. Based on the point–line duality, the existing model of continuous scatterplots is adapted to parallel coordinates for the visualization of data defined on continuous domains. To speed up computation and obtain interactive frame rates, a scalable and progressive rendering algorithm is introduced that further allows for arbitrary reconstruction and interpolation schemes. A curve-bundling model for parallel coordinates is evaluated with a user study showing that bundling is effective for cluster visualization based on geometric cues while being equally capable of revealing correlations between neighboring axes. To address the axis-order problem, a graph-based approach is presented that allows for the visualization of all pairwise relations in a matrix layout without redundancy. Finally, the use of parallel coordinates is demonstrated for real datasets from computational fluid dynamics, motion capturing, bioinformatics, and systems biology.
Visualisierung spielt eine zentrale Rolle für die Wissensfindung, in der visuellen Datenexploration und für Visual Analytics. Statische Bilder können effektiv für die visuelle Kommunikation sowie zur Extraktion von Strukturen und Mustern in großen und komplexen Datensätzen eingesetzt werden. Erst im Zusammenspiel mit Techniken der Mensch-Computer-Interaktion jedoch ermöglichen visuelle Schnittstellen dem Analysten große Informationsräume zu erkunden und den gesamten Prozess der Wissensfindung zu steuern. Streudiagramme und parallele Koordinaten sind verbreitete Visualisierungen, welche insbesondere in der klassischen (explorativen sowie deskriptiven) statistischen Datenanalyse und im Data-Mining verwendet werden, aber auch in der technischen Visualisierung immer mehr Anwendung finden. Während Streudiagramme aufgrund der orthogonalen Anordnung der Koordinatenachsen auf die Visualisierung von höchstens drei Dimensionen beschränkt sind, erlaubt ein paralleler Aufbau der Achsen die Darstellung mehrerer Attribute eines Datensatzes. Obwohl beide Techniken lediglich Projektionen höherdimensionaler Geometrien abbilden können und durch eine Punkt–Linie-Dualität sogar ineinander überführbar sind, erfreuen sich parallele Koordinaten einer wachsenden Beliebtheit für die Visualisierung und Analyse multivariater Daten. Trotz ihrer Beliebtheit bedarf es weiterer Forschung bezüglich einiger Aspekte von parallelen Koordinaten. So kann es aufgrund der potenziell starken Überlappung einzelner Linien für den Betrachter mitunter schwierig sein, interessante Merkmale in einem Parallelen-Koordinaten-Diagramm zu entdecken. Der Einsatz von Polygonzügen zur Darstellung von Beobachtungspunkten kann weiterhin dazu führen, dass einzelne Linien nicht oder nur schwer visuell über alle Achsen verfolgt werden können. Gruppen von Linien mit ähnlichen Eigenschaften (engl. cluster) können nicht geometrisch dargestellt werden und die Reihenfolge der Achsen wirkt sich entscheidend auf die entstehenden visuellen Muster aus. In dieser Dissertation werden daher Visualisierungstechniken vorgestellt, welche sich mit diesen Problemen befassen. Als Grundlage wird eine ausführliche Übersicht des aktuellen Stands der Forschung bezüglich paralleler Koordinaten gegeben. Basierend auf der Punkt–Linie-Dualität wird das bestehende Modell der kontinuierlichen Streudiagramme für die Visualisierung kontinuierlicher Daten auf parallele Koordinaten erweitert. Um eine interaktive Bildfrequenz zu erhalten, wird ein Beschleunigungsverfahren diskutiert, welches eine schrittweise, progressive Bildgenerierung sowie beliebige Rekonstruktionsfilter erlaubt. Weiterhin wird ein Verfahren zur Bündelung von Kurven in parallelen Koordinaten vorgestellt und evaluiert, welches nachweislich zu einer effizienteren Erkennung hochdimensionaler Cluster auf einer geometrischen Basis verwendet werden kann, während die Einschätzung linearer Korrelationen zwischen benachbarten Achsen weiterhin möglich bleibt. Schließlich wird eine graphentheoretische Methode vorgestellt, welche es erlaubt, alle paarweisen Relationen eines multivariaten Datensatzes redundanzfrei in parallelen Koordinaten darzustellen. Ein Teil der vorgestellten Visualisierungstechniken wird abschließend beispielhaft für die Analyse realer Datensätze aus der numerischen Strömungsmechanik, der Bewegungs-Erfassung, der Bioinformatik und der Systembiologie demonstriert.
Appears in Collections:13 Zentrale Universitätseinrichtungen

Files in This Item:
File Description SizeFormat 
Thesis_JH_20130712_electronic_downsampled_web.pdf14,57 MBAdobe PDFView/Open


Items in OPUS are protected by copyright, with all rights reserved, unless otherwise indicated.