Long-term motion prediction in traffic

Hengel, Katharina

Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.18419/opus-11994

Langanzeige der Metadaten

DC Element	Wert	Sprache
dc.contributor.author	Hengel, Katharina	-
dc.date.accessioned	2022-02-24T10:10:34Z	-
dc.date.available	2022-02-24T10:10:34Z	-
dc.date.issued	2020	de
dc.identifier.other	1795276193	-
dc.identifier.uri	http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-120116	de
dc.identifier.uri	http://elib.uni-stuttgart.de/handle/11682/12011	-
dc.identifier.uri	http://dx.doi.org/10.18419/opus-11994	-
dc.description.abstract	The field of Inverse Reinforcement Learning (IRL) addresses the task of finding a cost function which describes expert behavior. Since the cost function is solely computed from expert demonstrations, the sample complexity exerts influence on the performance of these algorithms. In this thesis we study the Learning to Search (LEARCH) and the maximum entropy IRL framework as example IRL techniques. Based on these two algorithms we develop a variation of the LEARCH algorithm using the idea of maximum entropy IRL. In the next step we extend LEARCH to Deep-LEARCH as well as the newly developed LEARCH variation to a equivalent Deep-LEARCH variation. Thereby we generalize the cost function to function space using Convolutional Neural Networks (CNNs). Including maximum entropy inside the Deep-LEARCH variation increases the density of the target maps of the CNN. We discover that LEARCH shows the lowest sample complexity among the investigated algorithms, while maximum entropy shows the highest sample complexity. In the deep learning setting the increased density of the CNN target maps did not improve the performance. Hence, the performance does not change, if the algorithms are extended by CNNs to the function space.	en
dc.description.abstract	Inverse Reinforcement Learning (IRL) hat das Ziel, eine Kostenfunktion zu finden, die das Verhalten eines Experten beschreibt. Die Kostenfunktion wird ausschließlich auf den gesammelten Daten des Experten berechnet. Daher beeinflusst die Menge der Beispieldaten das Verhalten und die Genauigkeit eines IRL Algorithmus. In dieser Arbeit wird das Learning to Search (LEARCH) framework und das Maximum Entropie IRL framework beispielhaft als IRL Methoden vorgestellt. Basierend auf diesen Algorithmen wird eine Variante des LEARCH Algorithmus entwickelt, die die Idee von Maximum Entropie aufgreift. Im nächsten Schritt ergänzen wir die eingeführten Algorithmen durch Convolutional Neural Networks (CNNs). Die Dichte der Ausgabeabbildung ist in der LEARCH Variante im Gegensatz zu LEARCH durch den Einsatz von Maximum Entropie erhöht. Wir untersuchen, wie sich dies auf die Beispielkomplexität auswirkt. In der Analyse zeigt LEARCH die geringste Komplexität an Beispielsdaten, wohingegen Maximum Entropie die höchste Beispieldatenkomplexität zeigt. Dies ändert sich nicht, wenn CNNs den Algorithmen hinzugefügt werden. Die erhöhte Dichte der Ausgabeabbildungen des CNNs in der LEARCH Variante könnte das Lernverhalten der LEARCH Variante nicht verbessern.	de
dc.language.iso	en	de
dc.rights	info:eu-repo/semantics/openAccess	de
dc.subject.ddc	004	de
dc.title	Long-term motion prediction in traffic	en
dc.type	masterThesis	de
ubs.fakultaet	Informatik, Elektrotechnik und Informationstechnik	de
ubs.institut	Institut für Parallele und Verteilte Systeme	de
ubs.publikation.seiten	70	de
ubs.publikation.typ	Abschlussarbeit (Master)	de
Enthalten in den Sammlungen:	05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Dateien zu dieser Ressource:

Datei	Beschreibung	Größe	Format
HengelKatharina.pdf		2,36 MB	Adobe PDF	Öffnen/Anzeigen

Zur Kurzanzeige

Alle Ressourcen in diesem Repositorium sind urheberrechtlich geschützt.

Universität Stuttgart

OPUS - Online Publikationen der Universität Stuttgart