Browsing by Author "Van Craen, Alexander"

Now showing 1 - 2 of 2

Open Access
GPU-beschleunigte Support-Vector Machines
(2018) Van Craen, Alexander
Data-Mining gewinnt immer mehr an Bedeutung, denn es stehen immer mehr Daten zur Verfügung. Um der stetig wachsenden Anzahl an Daten entgegenzuwirken, werden eine immer stärkere Hardware, bessere Algorithmen und optimierte Implementierungen benötigt. Es ist beispielsweise möglich mithilfe massiver Parallelität auf Grafikkarten die Rechenzeit zu verkürzen. Eine Möglichkeit Daten zu klassifizieren ist das überwachte maschinelle Lernen. Die Support-Vector Machine (SVM) ist eines dieser Verfahren. Sie erstellt ein Modell, worin die Trainingsdaten als Punkte im Raum interpretiert werden. Es werden diejenigen Datenpunkte gesucht, mit denen ein linearer Separator aufgestellt werden kann, der die Daten durch das breiteste Band voneinander trennt (large margin classifier). Anhand dieses gelernten Modells können dann neue Daten effizient klassifiziert werden. In dieser Arbeit wird eine Least Square Support Vektor Maschine implementiert. Bei der Least Squares Support Vektor Maschine werden nicht die wenigen Datenpunkte gesucht, die für die Separation wichtig sind (Support Vektoren), sondern bei allen Datenpunkten der proportionale Fehler bestimmt, und daraus die separierende Hyperebene abgeleitet. Die Least Squares Support Vektor Maschine wird mithilfe von NVIDIAs CUDA Parallel Programming Models für Grafikkarten implementiert und für NVIDIAs QUADRO GP100 optimiert. Dabei wurde explizit darauf geachtet, dass die GPU-Implementierung möglichst verzweigungsfrei ist. Außerdem wird die SoA Datenstruktur verwendet, und die Zugriffe über das Shared Memory optimiert. Damit konnte, bei ähnlicher Genauigkeit, auf der NVIDIAs QUADRO GP100 Grafikkarte, mit ca. 2,3 TFLOPS mit doppelter Genauigkeit, eine Laufzeitverbesserung um mehr als das 300-Fache gegenüber der gebräuchlichen CPU-Library for Support Vector Machines, LIBSVM, Implementierung gemessen werden.
Open Access
PISM Performance Profiling - Analyse einer Eisschild Simulation
(2020) Van Craen, Alexander
In der vorliegenden Masterarbeit wird der aktuelle Performancestand des Parallel Ice Sheet Model (PISM) evaluiert. Eine allgemeine Übersichtsanalyse ergibt, dass die Performance von PISM sowohl durch die Speicherbandbreite, also auch Netzwerkbandbreite und -latenz limitiert ist. Auf dieser Analyse aufbauend, werden ebenfalls mittels, sowohl automatisch generierten, als auch theoretisch hergeleiteten, Roofline Modellen, sowie Laufzeitmessungen einzelner Programmabschnitte die laufzeitkritischen Abschnitte identifiziert und analysiert. Für die herauskristallisierten Flaschenhälse und Hotspots, werden verschiedene Verbesserungsansätze dargelegt und diskutiert. Die detaillierte Analyse der Stressgleichungen ergibt beispielsweise eine mögliche Laufzeitreduzierung eben dieser um über 80 %. Anhand einer Implementierung wird die Umsetzbarkeit ausgewählter Verbesserungsansätze überprüft. Die Ergebnisse dieser Masterarbeit sind dabei von primärem Interesse für die PISM Entwickler. Das Vorgehen in dieser Arbeit ist exemplarisch für eine Performanceanalyse großer und kleiner Projekte und kann damit als Grundlage für weitere Analysen dienen, sodass die Masterarbeit auch für Leute interessant ist, die sich mit der Performance von wissenschaftlichem Programmcode auseinandersetzen.