05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Permanent URI for this collectionhttps://elib.uni-stuttgart.de/handle/11682/6

Browse

Search Results

Now showing 1 - 10 of 207
  • Thumbnail Image
    ItemOpen Access
    Quantifizierung von Unsicherheiten in mikroskopischer Verkehrssimulation
    (2017) Parga Cacheiro, Dominic
    Straßenverkehr ist allgegenwärtig. Jeden Tag fahren viele Menschen mit dem Auto durch die Straßen und dabei können sehr interessante Phänomene betrachtet werden, die den Verkehrsfluss verbessern oder verschlechtern. Beim Planen und Designen von Verkehrsnetzen ist es wichtig, solche Einflüsse zu berücksichtigen. Aus diesem Grund sind Verkehrssimulationen notwendig. Es gibt im wesentlichen zwei große Modelltypen. Die makroskopischen Modelle sehen den Verkehr als großes System und versuchen, dessen Phänomene aus einem globalen Blickwinkel zu erklären. Die mikroskopischen Modelle betrachten die Fahrzeuge einzeln, d.h. die Fahrzeuge agieren nicht von einer globalen Logikeinheit gesteuert, sondern selbstbestimmt und aus einem lokalen Blickwinkel heraus. In dieser Arbeit wird das Nagel-Schreckenberg-Modell verwendet, ein mikroskopisches Modell zur Beschreibung von Fahrverhalten auf einer einspurigen Straße, das mittels einfacher stochastischer Mittel Phänomene wie Staus aus dem Nichts hervorbringt. Dieses Modell wurde um eine allgemein gültige Kreuzungslogik erweitert. Im Rahmen dieser Arbeit wird das so entstandene Verkehrsmodell um die Mehrspurigkeit ergänzt. Das beinhaltet eine Überarbeitung der bestehenden Verkehrslogik und das Einführen von Spurwechseln inklusive Stauinversion. Im Anschluss wird auf Implementierungsdetails eingegangen und das Modell mit realen Daten verglichen, um qualitative Aussagen über den Verkehr zu machen.
  • Thumbnail Image
    ItemOpen Access
    Erschließen von Freitextfeldern mittels Text Mining und die Qualität der gewonnenen Informationen
    (2017) Link, Marco
    Vermehrt fallen innerhalb von Firmen neben den einfach auszuwertenden strukturierten Daten, auch unstrukturierte Daten in Form von Freitexten an. In dieser Ausarbeitung werden Techniken zur Strukturierung von Freitexten sowie verwandte Arbeiten und Vor- und Nachteile der Nutzung von Freitexten vorgestellt. Der Fokus liegt auf der Repräsentation der Daten als Vektoren und der Filterung von Stoppwörtern. Außerdem wird ein Prototyp zum Clustern von Freitextfeldern vorgestellt und auf einen Datensatz der NHTSA angewendet. Durch die Anwendung des Prototyps auf den NHTSA-Datensatz wird geklärt, inwiefern dieser Informationen in den Freitextfelder enthält, die nicht in den strukturierten Daten enthalten sind. Und ob das Clustering zu vollständigeren Informationen, das heißt zur erhöhter Datenqualität führt. Die Beantwortung geschieht durch Datenanalysen auf den vom Prototyp erweiterten Datensatz. Eine zusätzliche Anwendung und Auswertung des Prototyps, findet auf einen Datensatz aus der Industrie statt.
  • Thumbnail Image
    ItemOpen Access
    Gamifikation und Evaluierung eines Handy-Toolkits zur Bestimmung kognitiver Performanz
    (2017) Singer, Ken
    Unsere kognitive Performanz ist über den Tag hinweg starken Schwankungen unterlegen. Zu einem Teil sind insbesondere die zirkadianen Rhythmen für diese Schwankungen verantwortlich, welche von Mensch zu Mensch unterschiedlich sind und maßgeblich durch den Chronotypen der Person bestimmt werden. Zum anderen zeigen andere Faktoren, wie die vorherige Nahrungszunahme, Koffeinzufuhr, aber auch der vorangegangene Schlaf, Auswirkungen und tragen zu den Schwankungen bei. Nathaniel Kleitman gilt als der erste Wissenschaftler, dem ein Zusammenhang zwischen der kognitiven Performanz und den zirkadianen Rhythmen aufgefallen ist. Aufbauend auf seinen Erkenntnissen wird erforscht, wie sich diese Schwankungen am besten messen lassen, um in Zukunft Systemen die Möglichkeit zu geben, sich auf die momentane kognitive Leistung eines Menschen einstellen zu können. Diese Circadian-Aware-Systems sollen in Zukunft den Menschen unterstützen und entlasten. So könnten Kalenderapplikationen kognitiv anspruchsvolle Termine zu Zeiten planen, zu denen der jeweilige Mensch die geforderte kognitive Leistung erbringen kann. Das würde den Stress im Alltag verringern und stressbedingten Krankheiten entgegenwirken. In dieser Arbeit wird ein vorhandenes Toolkit zur Bestimmung der kognitiven Performanz gamifiziert, damit es sich besser als das bisherige Toolkit in den Alltag integrieren lässt. Dazu werden die einzelnen Aufgaben PVT, GNG und MOT in einen Spielablauf integriert und mit zusätzlichen Spiel-Design-Elementen ausgestattet. Anschließend wurde mit der Applikation eine Studie durchgeführt, um sie dahingehend zu evaluieren, ob sie die Schwankungen der kognitiven Performanz messen kann.
  • Thumbnail Image
    ItemOpen Access
    Analysing and improving the crypto ecosystem of Rust
    (2017) Keck, Philipp
    Context: Rust is an emerging systems programming language that suits security-critical applications because it guarantees memory safety without a garbage collector. Its growing ecosystem already encompasses several crypto libraries, though the competition is still open. Previous cryptography research found that vulnerabilities are often due to misunderstandings and misuse of cryptographic APIs rather than bugs in the libraries themselves. Aim: This thesis presents a holistic analysis of Rust's current crypto ecosystem and aims to improve its further development. A particular focus is on API design because all libraries are still open to change their APIs and it will become increasingly difficult to change them later. Method: All parts of the ecosystem are systematically analysed, guided by the general structure of a crypto ecosystem. Research methods include a systematic search for libraries, a survey among contributors, GitHub analyses as well as a self-experiment and a controlled experiment to test the usability. Results: The contributors are typical open source developers and they collaborate in typical ways on GitHub. Most libraries have a clear main developer and there is a general lack of contributors. While two of the major libraries focus on usability and are consequently easier to use and more resistant to misuse, the two most widespread libraries consciously neglect these topics and exhibit flaws known from crypto libraries in other languages. Conclusion: The misuse resistant Rust crypto libraries should be advertised more actively. In the medium term, an officially endorsed API could improve interoperability and foster competition. For such an API and for the improvement of existing APIs, the thesis discusses a number of design decisions and their usability implications.
  • Thumbnail Image
    ItemOpen Access
    Addressing TCAM limitations in an SDN-based pub/sub system
    (2017) Balogh, Alexander
    Content-based publish/subscribe is a popular paradigm that enables asynchronous exchange of events between decoupled applications that is practiced in a wide range of domains. Hence, extensive research has been conducted in the area of efficient large-scale pub/sub system. A more recent development are content-based pub/sub systems that utilize software-defined networking (SDN) in order to implement event-filtering in the network layer. By installing content-filters in the ternary content-addressable memory (TCAM) of switches, these systems are able to achieve event filtering and forwarding at line-rate performance. While offering great performance, TCAM is also expensive, power hunger and limited in size. However, current SDN-based pub/sub systems don't address these limitations, thus using TCAM excessively. Therefore, this thesis provides techniques for constraining TCAM usage in such systems. The proposed methods enforce concrete flow limits without dropping any events by selectively merging content-filters into more coarse granular filters. The proposed algorithms leverage information about filter properties, traffic statistics, event distribution and global filter state in order to minimize the increase of unnecessary traffic introduced through merges. The proposed approach is twofold. A local enforcement algorithm ensures that the flow limit of a particular switch is never violated. This local approach is complemented by a periodically executed global optimization algorithm that tries to find a flow configuration on all switches, which minimized to increase in unnecessary traffic, given the current set of advertisements and subscriptions. For both classes, two algorithms with different properties are outlined. The proposed algorithms are integrated into the PLEROMA middleware and evaluated thoroughly in a real SDN testbed as well as in a large-scale network emulation. The evaluations demonstrate the effectiveness of the approaches under diverse and realistic workloads. In some cases, reducing the number of flows by more than 70% while increasing the false positive rate by less than 1% is possible.
  • Thumbnail Image
    ItemOpen Access
    Optimizing the efficiency of data-intensive Data Mashups using Map-Reduce
    (2017) Sarangi, Sunayana
    In order to derive knowledge and information from data through data processing, data integration and data analysis, a variety of Data Mashup tools have been developed in the past. Data Mashups are pipelines that process and integrate data based on different interconnected operators that realize data operations such as filter, join, extraction, alteration or integration. The overall goal is to integrate data from different sources into a single one. Most of these Mashup tools offer a grahical modeling platform, enabling the users to model the data sources, data operations and the data flow, thus, creating a so called Mashup Plan. This enables non-IT experts to perform data operations without having to deal with their technical details. Further, by allowing easy re-modeling and re-execution of the Mashup Plan, it also allows an iterative and explorative trial-an-error integration to enable real time insights into the data. These existing Data Mashup tools are efficient in executing small size data sets, however, they do not emphasize on the run-time efficiency of the data operations. This work is motivated by the limitations of current Data Mashup approaches with regard to data-intensive operations. The run-time of a data operation majorly varies depending on the size of the input data. Hence, in scenarios where one data operation expects inputs from multiple Data Mashup pipelines, which are executed in parallel, a data intensive operation in one of the Data Mashup pipelines leads to a bottleneck, thereby delaying the entire process. The efficiency of such scenarios can be greatly improved by executing the data-intensive operations in a distributed manner. This master thesis copes with this issue through an efficiency optimization of pipeline operators based on Map-Reduce. The Map-Reduce approach enables distributed processing of data to improve the run-time. Map-Reduce is divided into two main steps: (i) the Map step divides a data set into multiple smaller data sets, on which the data operations can be applied in parallel, and (ii) the Reduce step aggregates the results into one data set. The goal of this thesis is to enable a dynamic decision making while selecting suitable implementations for the data operations. This mechanism should be able to dynamically decide, which pipeline operators should be processed in a distributed manner, such as using a Map-Reduce implementation, and which operators should be processed by existing technologies, such as in-memory processing by Web Services. This decision is important because Map-Reduce itself can lead to a significant overhead while processing small data sets. Once it is decided that an operation should be processed using Map-Reduce, corresponding Map-Reduce jobs are invoked that process the data. This dynamic decision making can be achieved through WS-Policies. Web Services use policies to declare in a consistent and standardized manner what they are capable of supporting and which constraints and requirements they impose on their potential requestors. By comparing the capabilities of the Web Service with the requirements of the service requestor, it can be decided if the implementation is suitable for executing the data operation.
  • Thumbnail Image
    ItemOpen Access
    Interaktive kontextsensitive Integration und Aufbereitung heterogener Datenquellen unter Verwendung von Data Mashups
    (2017) Trybek, Christoph
    Durch eine stetig anwachsende Menge an Daten wird es zunehmend schwieriger, diese aufzubereiten und zu integrieren. Da bisherige Lösungsansätze eine hohe technische Versiertheit erfordern ist es notwendig, die Aufgaben an IT-Experten zu delegieren, die keinerlei domänenspezische Kenntnisse über die vorliegenden Daten besitzen. Dies kann zu Fehlern oder einem erhöhten Kommunikationsaufwand führen. Aus diesem Grund sollten Domänenexperten, ohne tiefgründiges Programmierverständnis, in der Lage sein, umfangreiche Datensätze selbstständig aufzubereiten und zu integrieren. Data Mashups stellen einen leicht zu bedienenden Ansatz für die Verarbeitung von Daten dar und eignen sich deshalb besonders zur Einbindung von Anwendern ohne technischen Hintergrund. Im Rahmen der nachfolgenden Arbeit werden zunächst die notwendigen Schritte einer Datenintegration definiert und anschließend ein Konzept entwickelt, das den Anwender dabei unterstützt. Hierbei werden wiederkehrende Aufgaben vom System übernommen, deren Ausführungen gezielt durch den Anwender beeinflusst werden können. Dazu wurde eine Auswahl essentieller Operationen zur Datenaufbereitung definiert, sowie ein Klassifikationsverfahren entwickelt, welches den Anwender dabei unterstützt, eine interaktive Schemaintegration auszuführen. Der Anwender soll die Daten in einem gewohnten Tabellenformat aufbereiten und integrieren können. Um die Funktionalität des Konzepts zu verdeutlichen, wird ein Prototyp entwickelt, der die Grundlage für eine Implementierung in FlexMash, ein an der Universität Stuttgart entwickeltes Data Mashup-Werkzeug, bildet.
  • Thumbnail Image
    ItemOpen Access
    Planung von verlässlichen Workflowausführungen
    (2017) Höhn, Patric
    Workflows beschreiben den zeitlichen Ablauf eines komplexen Prozesses. In dieser Arbeit beschäftigen wir uns mit deren Ausführung auf fehleranfälligen Systemen. Wir entwickeln Strategien um diese Ausfühung möglichst effizient und optimal zu planen. Die Planung und Ausführung auf verteilten Systemen stehen dabei im Fokus. Unsere Strategien führen die Planung unter anderem verteilt aus oder teilen einen Workflow in mehrere Teile auf, um die Planungszeit zu verkürzen. Wir testen die Strategien in einem simulierten Netzwerk und stellen die Ergebnisse in einer Evaluation detailiert dar. Es zeigt, sich dass sich durch unsere Strategien unter bestimmten Bedingungen die Dauer für die Ausführungsplanung drastisch verkürzen lässt und die Zeit für eine erfolgreiche Workflowausführung dabei verhältnismäßig gering ansteigt, sodass die Gesamtdauer von Planung und Ausführung deutlich verkürzt werden kann.
  • Thumbnail Image
    ItemOpen Access
    Entwicklung von Algorithmen zur Planung der Wege von fahrerlosen Transportsystemen in einem Logistik-Warehouse
    (2017) Braunschweiger, Dirk
    In der Automobilindustrie ist in den letzten Jahren die Anforderungen an die Logistik-Warenhäuser gestiegen. Die steigende Individualisierung von Fahrzeugen ist der Grund dafür. Um die Anforderungen erfüllen zu können, werden in modernen Logistik-Warenhäusern die Waren durch fahrerlose Transportfahrzeuge transportiert. Es existieren viele Algorithmen zur Berechnung des kürzesten Weges für einzelne Fahrzeuge. Diese können in Warenhäusern mit vielen Fahrzeugen nicht eingesetzt werden, da es zu Staus, Deadlocks oder Kollisionen kommen kann. Es existieren bereits Algorithmen, die versuchen diese Probleme zu lösen. Wenige dieser Algorithmen wurden bisher auf die Praxistauglichkeit getestet. Die Algorithmen werden oft mit wenigen Fahrzeugen oder auf kleinen Straßennetzen getestet. Diese Arbeit stellt Algorithmen zur Berechnung von Wegen für mehrere Fahrzeuge vor und analysiert diese anschließend. Die Performanz der Algorithmen wird anhand realer Szenarien aus der Automobilindustrie gemessen. Dafür werden zuerst Straßennetze basierend auf echten Lagerhallen erstellt. Anschließend wird in verschiedenen Benchmarks die Performanz ausgewählter Algorithmen miteinander verglichen. Basierend auf den besten Algorithmen wird ein neuer Algorithmus entwickelt und mit bestehenden Algorithmen verglichen. Der neue Algorithmus benötigt weniger Rechenzeit und berechnet kürzere Wege. Die Ergebnisse werden abschließend mithilfe einer Simulations-Software validiert.
  • Thumbnail Image
    ItemOpen Access
    Measurement of the quality of structured and unstructured data accumulating in the product life cycle in a data quality dashboard
    (2017) Chellathurai Saroja, Shalini
    This thesis provides an overview on existing data quality metrics for structured and unstructured data as well as on the existing data quality dashboards for measuring the quality of structured and unstructured data. Open research questions for interpreting the data quality are discussed. The metrics percentage of null values, percentage of duplicate values and percentage of non-domain values were selected and implemented as REST based web services. Furthermore, a web application was developed to enable (1) upload of the data file for which data quality shall be assessed from two standard formats JSON and CSV and (2) flexible integration of various data quality metrics. The latter is enabled by using an interface. To illustrate the functionality of this interface, the metric percentage of spelling mistakes provided by the supervisor of the thesis is integrated with the web application. The data quality is indicated as percentage in the range from 0 to 100 as well as encoded with colors for the whole dataset and for each column. Donut chart or pie chart visualizations are implemented for the chosen data quality metrics. The implemented web application and metrics were evaluated with the example datasets for data accumulating in the product life cycle as provided by the supervisor. Finally, the dashboard is compared with existing data quality dashboards and the results are tabulated.