Universität Stuttgart

Permanent URI for this communityhttps://elib.uni-stuttgart.de/handle/11682/1

Browse

Search Results

Now showing 1 - 10 of 523
  • Thumbnail Image
    ItemOpen Access
    Generic templates for monitoring agents
    (2018) Weise, Marc
    This thesis presents an agent-centric approach for monitoring IT resources, which enables the execution of preprocessing and aggregation steps directly on the target systems in order to limit data transfers to a central server and allow a local event detection and treatment. To keep the agent behavior definition as simple as possible, an extendable template model is introduced which can be used to define Monitoring Pipelines by chaining individual processing steps. Furthermore this work demonstrates how a graphical editor can be implemented which also allows non-experts in the field of monitoring to create and modify Monitoring Templates.
  • Thumbnail Image
    ItemOpen Access
    Quantifizierung von Unsicherheiten in mikroskopischer Verkehrssimulation
    (2017) Parga Cacheiro, Dominic
    Straßenverkehr ist allgegenwärtig. Jeden Tag fahren viele Menschen mit dem Auto durch die Straßen und dabei können sehr interessante Phänomene betrachtet werden, die den Verkehrsfluss verbessern oder verschlechtern. Beim Planen und Designen von Verkehrsnetzen ist es wichtig, solche Einflüsse zu berücksichtigen. Aus diesem Grund sind Verkehrssimulationen notwendig. Es gibt im wesentlichen zwei große Modelltypen. Die makroskopischen Modelle sehen den Verkehr als großes System und versuchen, dessen Phänomene aus einem globalen Blickwinkel zu erklären. Die mikroskopischen Modelle betrachten die Fahrzeuge einzeln, d.h. die Fahrzeuge agieren nicht von einer globalen Logikeinheit gesteuert, sondern selbstbestimmt und aus einem lokalen Blickwinkel heraus. In dieser Arbeit wird das Nagel-Schreckenberg-Modell verwendet, ein mikroskopisches Modell zur Beschreibung von Fahrverhalten auf einer einspurigen Straße, das mittels einfacher stochastischer Mittel Phänomene wie Staus aus dem Nichts hervorbringt. Dieses Modell wurde um eine allgemein gültige Kreuzungslogik erweitert. Im Rahmen dieser Arbeit wird das so entstandene Verkehrsmodell um die Mehrspurigkeit ergänzt. Das beinhaltet eine Überarbeitung der bestehenden Verkehrslogik und das Einführen von Spurwechseln inklusive Stauinversion. Im Anschluss wird auf Implementierungsdetails eingegangen und das Modell mit realen Daten verglichen, um qualitative Aussagen über den Verkehr zu machen.
  • Thumbnail Image
    ItemOpen Access
    Distributed Deep Reinforcement Learning for Learn-to-optimize
    (2023) Mayer, Paul
    In the context of increasingly complex applications, e.g., robust performance tuning in Integrated Circuit Design, conventional optimization methods have difficulties in achieving satisfactory results while keeping to a limited time budget. Therefore, learning optimization algorithms becomes more and more interesting, replacing the established way of hand-crafting or tweaking algorithms. Learned algorithms reduce the amount of assumptions and expert knowledge necessary to create state-of-the-art solvers by decreasing the need of hand-crafting heuristics and hyper-parameter tuning. First advancements using Reinforcement Learning have shown great success in outperforming typical zeroth- and first-order optimization algorithms, especially with respect to generalization capabilities. However, training still is very time consuming. Especially challenging is training models on functions with free parameters. Changing these parameters (that could represent, e.g., conditions in a real world example) affects the underlying objective function. Robust solutions therefore depend on thorough sampling, which tends to be the bottleneck considering time consumption. In this thesis we identified the runtime bottleneck of the Reinforcement Learning Algorithm and were able to decrease runtime drastically by distributing data collection. Additionally, we studied the effects of combining sampling strategies in regards to generalization capabilities of the learned algorithm.
  • Thumbnail Image
    ItemOpen Access
    Erschließen von Freitextfeldern mittels Text Mining und die Qualität der gewonnenen Informationen
    (2017) Link, Marco
    Vermehrt fallen innerhalb von Firmen neben den einfach auszuwertenden strukturierten Daten, auch unstrukturierte Daten in Form von Freitexten an. In dieser Ausarbeitung werden Techniken zur Strukturierung von Freitexten sowie verwandte Arbeiten und Vor- und Nachteile der Nutzung von Freitexten vorgestellt. Der Fokus liegt auf der Repräsentation der Daten als Vektoren und der Filterung von Stoppwörtern. Außerdem wird ein Prototyp zum Clustern von Freitextfeldern vorgestellt und auf einen Datensatz der NHTSA angewendet. Durch die Anwendung des Prototyps auf den NHTSA-Datensatz wird geklärt, inwiefern dieser Informationen in den Freitextfelder enthält, die nicht in den strukturierten Daten enthalten sind. Und ob das Clustering zu vollständigeren Informationen, das heißt zur erhöhter Datenqualität führt. Die Beantwortung geschieht durch Datenanalysen auf den vom Prototyp erweiterten Datensatz. Eine zusätzliche Anwendung und Auswertung des Prototyps, findet auf einen Datensatz aus der Industrie statt.
  • Thumbnail Image
    ItemOpen Access
    Personenbezogene Daten im Data Lake
    (2018) Ebinger, Felix
    Big-Data-Analysen bieten Wettbewerbsvorteile, ermöglichen Innovationen und können zu einer höheren Qualität von Produkten oder Serviceleistungen beitragen. Insbesondere die Analyse von Kundendaten und des Kundenverhaltens eröffnet vielfältige Möglichkeiten, um dem Kunden auf ihn zugeschnittene Angebote zu unterbreiten und um so zu höheren Umsätzen und zu einer höheren Kundenzufriedenheit beizutragen. Für die dafür benötigten Daten werden geeignete Speichersysteme benötigt. Ein solches System stellt der Data Lake dar. Neben der gut skalierenden und günstigen Speicherung von Daten ist auch die Auswertung der Daten mittels explorativer Analysen bereits im Design angelegt. Gleichzeitig steht aber auch der Schutz, genauer der fehlende Schutz der Privatsphäre, des Einzelnen bei Big Data Verarbeitungen im Mittelpunkt der öffentlichen Aufmerksamkeit und Kritik. Insbesondere wird vor dem so entstehenden „gläsernen Menschen“ und den daraus resultierenden gesellschaftlichen Folgen gewarnt. Die sich daraus ergebenden Fragen, in welchem Umfang und auf welche Art personenbezogene Daten verarbeitet werden dürfen, bedürfen, neben einer ethisch-moralischen, vor allem einer rechtlichen Antwort. Die europäische Datenschutzgrundverordnung stellt hierzu den rechtlichen Rahmen dar, in dem personenbezogene Daten verarbeitet werden dürfen. In dieser Arbeit werden die gesetzlichen Anforderungen mit dem Konzept des Data Lakes abgeglichen und es wird aufgezeigt, wo Herausforderungen beim Design und bei der Implementierung eines Data Lakes entstehen (z.B. Transparenz, Zweckbindung, Recht auf Löschung). Zudem werden Lösungsansätze für diese Herausforderungen entwickelt und vorgestellt. Aus den einzelnen Lösungsansätzen werden zwei Lösungskonzepte für einige der identifizierten Herausforderungen entwickelt. Eines der Konzepte, ein Metadaten-Modell, wird dabei prototypisch umgesetzt und anhand von Use Cases beispielhaft getestet.
  • Thumbnail Image
    ItemOpen Access
    Scheduling with uncertainty for Time-Sensitive Networking using robust optimization techniques and integer linear programming
    (2024) Bauer, Florian
    Application services depend on the network to guarantee reliability, which is critical for safety and correct operation. Time-Sensitive Networking is a technology for reliable real-time communication of time-sensitive applications. While many schedulers exist that provide reliability for wired Time-Sensitive Networks (TSN) with the assumption of deterministic packet delays, scheduling for wireless TSN with uncertain packet delays has received significantly less attention. This work leverages the methodology of Robust Optimization (RO) to propose a robust scheduling approach that ensures provable reliability for both wired and wireless TSN. An uncertainty set defines the range of possible values, ensuring that the schedule remains feasible under all possible realizations within this set. As uncertainty sets are a key component in RO, we introduce methods to compute boxed and polytope uncertainty sets containing possible packet delays based on a set of given reliability requirements. A scheduler is deemed robust if it satisfies the given reliability constraints for all possible packet delays within the computed uncertainty set. Although robustness can be achieved through strict isolation and conservative filtering of packets, we demonstrate that several limitations prevent known robust schedulers from fully exploiting arbitrary uncertainty set shapes. As certain problem instances are unsolvable using simple boxed uncertainty sets, we indicate the need for schedulers that can utilize complex shapes of uncertainty sets rather than boxes. In response to this challenge, we introduce Uncertain No-Wait Packet Scheduling (UNWPS), a scheduler capable of computing robust schedules, and prove that UNWPS is robust against arbitrary upper-bounded boxed and polytope uncertainty sets. We assess the influence of uncertainty sets on the quality of the resulting UNWPS schedules, compare their performances to the performance of other robust scheduling approaches across various exemplary TSN networks and message stream configurations and carry out simulations conducted using the DetCom simulation framework to validate the robustness of UNWPS empirically.
  • Thumbnail Image
    ItemOpen Access
    Design und Implementierung eines Konzepts zur eindeutigen Identifizierung von Softwarekomponenten auf Geräten im IIoT-Umfeld
    (2019) Güth, Jan
    Unter dem Begriff Internet der Dinge (Internet of Things (IoT)) werden Konzepte und Technologien zusammengefasst, die physischen Geräten die Vernetzung mit dem Internet ermöglichen. Beim Begriff des klassischen IoT stehen in erster Linie die Vernetzung von Geräten im privaten Umfeld, wie z.B. Haushaltsgeräte, im Mittelpunkt. In den letzten Jahren haben sich jedoch einige Teilgebiete entwickelt, wie beispielsweise der Bereich des Industrial Internet of Things (IIoT), oft auch als Industrie 4.0 bezeichnet. Beim IIoT steht nicht der Verbraucher, sondern industrielle Prozesse und Abläufe im Mittelpunkt, die Probleme in den verschiedenen Teilgebieten sind jedoch meist dieselben. Eines dieser Probleme stellt die Identifizierung von Geräten und Software dar. Die Identifikation von Geräten mit eindeutigen und unveränderlichen Hardwaremerkmalen ist relativ leicht zu lösen, die eindeutige Identifikation von Software nicht. Die vorliegende Arbeit befasst sich mit der Ausarbeitung eines Konzepts zur eindeutigen Identifizierung von Software auf verschiedenen Geräten. Dabei soll der Identifizierungsmechanismus zur Einhaltung von Softwarelizenzbedingungen verwendet werden können. Auch verschiedene Ausführungsumgebungen, wie beispielsweise virtuelle Maschinen, sollen im Konzept berücksichtigt werden. Des Weiteren wird untersucht, ob auch eine hardwarebasierte Sicherheitstechnologie wie Intel SGX zur Lösung des Identifikationsproblems eingesetzt werden kann. Durch eine prototypische Implementierung und eine abschließende Evaluierung wird gezeigt, dass der entwickelte Identifizierungsmechanismus eine Unterscheidung von verschiedenen Geräten und der darauf ausgeführten Software zulässt und somit auch zur Einhaltung von Softwarelizenzbedingungen verwendet werden kann.
  • Thumbnail Image
    ItemOpen Access
    Octo-Tiger: Binary star systems with HPX on Nvidia P100
    (2018) Daiß, Gregor
    Stellar mergers between two suns are a significant field of study since they can lead to astrophysical phenomena such as type Ia supernovae. Octo-Tiger simulates merging stars by computing self-gravitating astrophysical fluids. By relying on the high-level library HPX for parallelization and Vc for vectorization, Octo-Tiger combines high performance with ease of development. For accurate simulations, Octo-Tiger requires massive computational resources. To improve hardware utilization, we introduce a stencil-based approach for computing the gravitational field using the fast multipole method. This approach was tailored for machines with wide vector units like Intel's Knights Landing or modern GPUs. Our implementation targets AVX512 enabled processors and is backward compatible with older vector extensions (AVX2, AVX, SSE). We further extended our approach to make use of available NVIDIA GPUs as coprocessors. We developed a tasking system that processes critical compute kernels on the GPU or the processor, depending on their utilization. Using the stencil-based fast multipole method, we gain a consistent speedup on all platforms, over the classical interaction-list-based implementation. On an Intel Xeon Phi 7210, we achieve a speedup of 1.9x. On a heterogeneous node with an Intel Xeon E5-2690 v3, we can obtain a speedup of 1.46x by adding an NVIDIA P100 GPU.
  • Thumbnail Image
    ItemOpen Access
    Learning free-surface flow with physics-informed neural networks
    (2021) Hurler, Marcel
    This thesis examines the application of physics-informed neural networks to solve free-surface flow problems modeled with the shallow water equations. Physics-informed neural networks allow training of a surrogate model that resembles the latent solution of an underlying partial differential equation, without using any training data sampled from experiments or numerical simulations. The shallow water equations are an approximation of the Navier stokes equations and serve as a model to many environmental flow problems including dam-breaks, floods, and tsunami propagation. The equations form a non-linear system of hyperbolic partial differential equations that describe the evolution of a fluid's depth and momentum through time. Contrary to other models for free-surface flow, where the exact location of the free surface is only given implicitly as an isosurface and needs reconstruction, here, the depth directly yields its location. One characteristic of the shallow water equations is the formation of steep wavefronts and discontinuities. The thesis examines four state-of-the-art techniques to improve accuracy and training speed and discusses their behavior on three initial value problems. These include the famous idealized dam-break and two depth perturbations, one above a flat and one above varying bathymetry. For each of the scenarios, an inspection of suitable network architectures was considered. Additionally, three different formulations of the physics-informed neural network are presented and tested, where one approach implicitly fulfills the mass conservation and thus eliminates one equation of the system. The results show, that it is possible to train a surrogate model with a relative L^2 error of less than 10^(-4) compared to a solution computed by a high-resolution numerical solver in case of a moderate steepening of wavefronts. A relative error close to 10^(-3) can be achieved for the dam break problem, where the initial conditions are discontinuous, and the solution contains shocks that propagate over time. Additionally, it shows that training with bathymetry is possible and the learned depth approximates the varying underground without any noticeable difference.
  • Thumbnail Image
    ItemOpen Access
    Addressing TCAM limitations in an SDN-based pub/sub system
    (2017) Balogh, Alexander
    Content-based publish/subscribe is a popular paradigm that enables asynchronous exchange of events between decoupled applications that is practiced in a wide range of domains. Hence, extensive research has been conducted in the area of efficient large-scale pub/sub system. A more recent development are content-based pub/sub systems that utilize software-defined networking (SDN) in order to implement event-filtering in the network layer. By installing content-filters in the ternary content-addressable memory (TCAM) of switches, these systems are able to achieve event filtering and forwarding at line-rate performance. While offering great performance, TCAM is also expensive, power hunger and limited in size. However, current SDN-based pub/sub systems don't address these limitations, thus using TCAM excessively. Therefore, this thesis provides techniques for constraining TCAM usage in such systems. The proposed methods enforce concrete flow limits without dropping any events by selectively merging content-filters into more coarse granular filters. The proposed algorithms leverage information about filter properties, traffic statistics, event distribution and global filter state in order to minimize the increase of unnecessary traffic introduced through merges. The proposed approach is twofold. A local enforcement algorithm ensures that the flow limit of a particular switch is never violated. This local approach is complemented by a periodically executed global optimization algorithm that tries to find a flow configuration on all switches, which minimized to increase in unnecessary traffic, given the current set of advertisements and subscriptions. For both classes, two algorithms with different properties are outlined. The proposed algorithms are integrated into the PLEROMA middleware and evaluated thoroughly in a real SDN testbed as well as in a large-scale network emulation. The evaluations demonstrate the effectiveness of the approaches under diverse and realistic workloads. In some cases, reducing the number of flows by more than 70% while increasing the false positive rate by less than 1% is possible.