05 Fakultät Informatik, Elektrotechnik und Informationstechnik
Permanent URI for this collectionhttps://elib.uni-stuttgart.de/handle/11682/6
Browse
4 results
Search Results
Item Open Access Framework für beschleunigte Monte-Carlo-Molekularsimulationen auf hybriden Architekturen(2012) Halder, SebastianIn der Thermodynamik können Monte-Carlo-Molekularsimulationen eingesetzt werden, um makroskopische Eigenschaften eines Molekularsystems zu beobachten. Diese Simulationen sind äußerst rechenintensiv. Aktuelle und kommende Generation von eng gekoppelten Mehrkernprozessoren und Grafikprozessoren (GPGPUs) bieten ein großes Potential an Rechenleistung, welches sie für solche Simulationsanwendungen besonders interessant macht. Die dieser Arbeit zu Grunde liegende Markov-Chain-Monte-Carlo-Molekularsimulation (MCMC/GCMC) basiert jedoch auf der Erzeugung einer Markovkette, d.h. jeder Simulationsschritt hängt vom Vorhergehenden ab. Diese inhärente serielle Abhängigkeit erschwert die Parallelisierung des Problems erheblich. In der vorliegenden Arbeit wurden Konzepte und Implementierungen für ein Framework entwickelt, welches eine effiziente Simulation von Monte-Carlo-Simulationen mit Markovketteneigenschaften auf hybriden Architekturen ermöglicht. Diese Konzepte umfassen eine Simulations-Zustandsmaschine mit Unterstützung verschiedener Architekturen und eine Schnittstelle für mehrere simultan zu simulierende Monte-Carlo-Schritte. Darüber hinaus wurde die zu Grunde liegende Parallelisierung einer Grand-Canonical Monte-Carlo-Simulation auf hybriden Architekturen weiterentwickelt und beschleunigt. Die entstandene Implementierung wurde auf die erzielbare Leistung überprüft. Alle im Rahmen dieser Arbeit entstandenen Simulationsergebnisse wurden durch Vergleich mit einer Referenzimplementierung auf ihre Korrektheit überprüft. Im Vergleich zu einer rein seriellen Simulation wurde dabei ein Speedup durch den Einsatz von hybriden Architekturen von 494x erreicht.Item Open Access CUDA-accelerated delay fault simulation(2011) Schneider, EricIn todays VLSI chip manufacturing processes variations occur, that may manifest as delay defects and affect the timing behaviour of the circuit. In general, these delay faults only occur under at-speed test conditions and it requires special effort to simulate them. Since fault simulation is inherently parallelizable, NVIDIAs Compute Unified Device Architecture (CUDA) is used for utilizing general purpose graphics processing units (GPGPUs) in order to exploit available parallelism. The goal of this study thesis was the implementation of a delay fault simulator to simulate the behaviour of small delay faults on CUDA devices and its integration into a diagnosis framework for application of the Partially Overlapping Impact couNTER (POINTER) algorithm. A series of experiments was performed to observe the diagnosability of the delay faults.Item Open Access Simulation of realistic defects for validating test- and diagnosis-algorithms(2011) Atali, Hossam elTesting and diagnosis are very important in the manufacture of Integrated Circuits (ICs) due to the decrease in technology size. Diagnosis aims to detect and localize faults and obtain information about them and many diagnosis algorithms exist for that purpose. These diagnosis algorithms, however, apply heuristics and therefore must be evaluated with realistic test cases to determine their efficiency. The goal of this thesis is to obtain a realistic set of bridging faults to inject for evaluation of the diagnosis algorithm presented by Holst in the ADAMA tool. To achieve this, the multi-node inductive fault analysis algorithm presented by Zachariah and Chakravarty was implemented. Multi-node bridging fault lists were obtained and passed to ADAMA for diagnosis. Simulations were run on several circuits and the results of the inductive fault analysis were compared to those obtained from random fault generation.Item Open Access Parallele Partikelsimulation auf GPGPU-Architekturen zur Evaluierung von Apoptose-Signalwegen(2012) Schöll, AlexanderIn dieser Arbeit wird die Abbildung eines Simulationsalgorithmus auf eine GPGPU-Architektur vorgestellt, der unter den Kriterien einer größtmöglich erreichbaren Effizienz parallelisiert und an die Parameter der GPGPU-Architektur angepasst wurde. Die Simulation dient der Evaluierung von Apoptose-Signalwegen. Der Vorgang der Apoptose ist eine Form des programmierten Zelltods, der in mehrzelligen Organismen vorkommt. Im Entstehungsprozess einer Krebserkrankung ist das Ausbleiben dieses Vorganges ein wesentlicher Bestandteil. Die Apoptose wird eingeleitet, wenn sich spezielle Rezeptoren auf der Zellmembran zu einem Cluster zusammenschließen. Innerhalb der Simulation wird dieser Vorgang stochastisch modelliert, ausgewertet und auf Clusterbildung hin untersucht. Die Rezeptoren werden durch Partikel modelliert, die über Drehmomente und Kräfte verfügen, womit sie sich gegenseitig anziehen. Die Modellierung erfolgt über das so genannte Lennard-Jones Potential. Zur Lösung des stochastischen Gleichungssystems wird die Euler-Maruyama-Approximation angewendet. Neben einer kurzen Einführung in das Themenfeld des programmierten Zelltodes und eines Überblicks über den aktuellen Stand der Forschung, werden in dieser Arbeit das stochastische Modell und dessen Grundlagen erläutert. Darüber hinaus werden verschiedene Lösungsansätze und deren Implementierung zur Optimierung des Simulationsalgorithmus im Kontext der verwendeten GPGPU-Architektur vorgestellt. In diesem Zusammenhang wird die Optimierung durch die Anwendung eines gitterbasierten Ansatzes im Einzelnen erläutert. In einer abschließenden Analyse wird ein Überblick über die erreichten Ziele gegeben. Die Abbildung der Simulation auf eine GPGPU-Architektur birgt Speedup-Potentiale in der Größenordnung von 320x.