Entwicklung eines Cache- und SSE2-optimierten Lattice-Boltzmann-Strömungssimulationsprogramms
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Aktuelle Consumer-Prozessoren haben wegen ihres guten Preis-/Leistungsverhältnisses den Weg in moderne Hochleistungsrechner gefunden. Es liegt also nahe, sich im Bereich der Computersimulation mit den Besonderheiten dieser Prozessoren auseinanderzusetzen. Eine dieser Besonderheiten sind die SSE-Befehlssatzerweiterungen, die seit SSE2 Fließkommaberechnungen doppelter Genauigkeit unterstützen. Die Einsatzgebiete von SSE sind vielfältig. Beispielsweise bietet SSE Befehle, um arithmetische Operationen auf mehreren Datenworten gleichzeitig durchzuführen, und unterschiedliche Lade- und Speicherbefehle, um das Caching-Verhalten zu beeinflussen. Im Rahmen der Arbeit wurde zunächst ein Lattice-Boltzmann-Simulationsprogramm entwickelt und mit gängigen Methoden wie z.B. Loop-Blocking das Caching-Verhalten optimiert. Darauf aufbauend wurden unterschiedliche Möglichkeiten zum Einsatz von SSE gesucht und getestet.