Please use this identifier to cite or link to this item: http://dx.doi.org/10.18419/opus-6150
Authors: Lindner, Peggy
Title: Management von verteilten ingenieurwissenschaftlichen Anwendungen in heterogenen Grid-Umgebungen
Other Titles: Management of distributed scientific applications in heterogeneous Grid environments
Issue Date: 2007
metadata.ubs.publikation.typ: Dissertation
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-32412
http://elib.uni-stuttgart.de/handle/11682/6167
http://dx.doi.org/10.18419/opus-6150
Abstract: Grid Technologien stellen einen Lösungsansatz für die Verteilung von Anwendungen über mehrere Rechner dar, um Simulationen von wissenschaftlichen Problemen durchführen zu können, die hohe Anforderungen an Rechenressourcen haben. Während diese Art von Anwendungen in den letzten Jahren meistens noch zu Demonstrationszwecken eingesetzt wurde, ist die Grid Technologie heute mehr und mehr ein Werkzeug im täglichen Einsatz. Dabei ist die Heterogenität der vorhandenen Grid Software Umgebungen das größte Problem mit dem Benutzer umgehen müssen, wenn sie parallele, verteilte Anwendungen effizient im Grid ausführen wollen. Im Rahmen dieser Arbeit wird das Konzept und die Implementierung eines Grid Configuration Managers (GCM) vorgestellt, der die Komplexität der Grid Umgebungen und die damit verbundenen Probleme vor dem Benutzer verbergen soll. Das wichtigste Ziel des GCM ist die Vereinfachung des Managements von Grid Umgebungen für Endanwender und Entwickler. Dafür wurden die für die Ausführung von verteilten, parallelen Anwendungen notwendigen Schritte abstrahiert. Des Weiteren wurde ein Konzept für die Integration verschiedener Grid Software Lösungen entwickelt und implementiert. Zurzeit unterstützt der GCM Globus, UNICORE und ssh basierende Umgebungen. Der GCM soll Benutzer hauptsächlich während drei Phasen der Ausführung von Anwendungen helfen: bei der Definition einer Grid Konfiguration, beim Starten und bei der Überwachung einer Grid Anwendung. Der GCM bietet außerdem noch eine spezielle Unterstützung für verteilte Anwendungen, die auf Basis der Kommunikationsbibliothek PACX-MPI entwickelt wurden. Dafür werden die benötigten Konfigurationsdateien automatisch erstellt und auf den beteiligten Rechnern konsistent gehalten. In den Grid Configuration Manager wurde ein auf Leistungsvorhersage basierender Mechanismus zur Auswahl von Rechenressourcen integriert. Ausgehend von einer durch den Benutzer spezifizierten Vorauswahl an Rechnern kann der GCM anhand einer automatischen Abschätzung von Leistungsdaten einer Anwendung vorhersagen, was die effizienteste Umgebung für die Ausführung der Anwendung ist. Für die Leistungsvorhersage wird das Programm Dimemas benutzt. Dimemas kann eine Vorhersage für das Laufzeitverhalten einer Anwendung anhand von Tracing-Daten und Parameter zur Beschreibung der Hardware treffen. Der Grid Configuration Manager wurde in verschiedenen Szenarien getestet und eingesetzt. Dabei wurde aufgezeigt, dass die Handhabung von verteilten Anwendungen durch die Verwendung des GCM signifikant vereinfacht und die Festlegung der Ausführungsumgebung erleichtert wird.
Deploying Grid technologies by distributing an application over several machines is widely emerging for scientific simulations, which have large requirements for computational resources. While in the last couple of years distributed simulations were often executed on a pure demonstration level, currently ongoing work is focusing on taking the steps necessary to use the technology in an every day production environment. One of the major problems end-users are facing is the diversity in the available Grid-software environments. This work presents the concept and implementation of a Grid Configuration Manager (GCM), a tool developed to hide some of the complexity of Grid environments from the end-user. The central objective of GCM is to ease the handling of computational Grid environments for end-users and application developers, by abstracting the steps necessary for submitting computational jobs and implementing them for various Grid software environments. Up to now, GCM supports Globus, UNICORE and ssh based environments. The GCM assists users during three phases of the execution of an application: defintion of a Grid configuration, job submission and monitoring. Furthermore, GCM supports the generation and management of distributed multi-site jobs on the basis of the communication library PACX-MPI, by generating the according configuration files and keeping them consistent on all machines participating in the current simulation. The Grid Configuration Manager integrates a performance based resource brokering mechanism. The basic idea is, that given a pool of machines, GCM can decide based on the prediction of the application performance on various machines or combination of machines, which one to use. The performance prediction step is based on Dimemas. Dimemas can estimate the performance of an application based on an initial tracefile for varying network and machine parameters like network latency or bandwidth. The Grid Configuration Manager was tested and deployed in various scenarios. It has been shown, that the handling of scientific, computational jobs in heterogeneous Grid environments was significant easier and the determination of the execution environment was facilitated for users by utilization of the GCM.
Appears in Collections:13 Zentrale Universitätseinrichtungen

Files in This Item:
File Description SizeFormat 
lindner.pdf2,39 MBAdobe PDFView/Open


Items in OPUS are protected by copyright, with all rights reserved, unless otherwise indicated.