Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.18419/opus-9510
Autor(en): Hofmann, Michael
Titel: Advanced variational methods for dense monocular SLAM
Erscheinungsdatum: 2016
Dokumentart: Abschlussarbeit (Master)
Seiten: 125
URI: http://elib.uni-stuttgart.de/handle/11682/9527
http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-95271
http://dx.doi.org/10.18419/opus-9510
Zusammenfassung: Structure from Motion (SfM) denotes one of the central problems in computer vision. It deals with the reconstruction of a static scene from an image sequence of a single moving camera. This task is typically divided into two alternating stages: tracking, which tries to identify the camera’s position and orientation with respect to a global coordinate system, and mapping, which uses this information to create a depth map from the current camera frame. There are already numerous approaches in the literature concerning local reconstruction techniques which attempt to create sparse point clouds from selected image features. However, the resulting scene information is often insufficient for many fields of application like robotics or medicine. Therefore, dense reconstruction has become more and more prominent in recent research. In 2011, Newcombe et al. presented a new technique called DTAM (Dense Tracking and Mapping), which was one of the first to create fully dense depth maps based on variational methods. Since then, most of the follow-up work concentrated on performance rather than on qualitative optimization due to DTAM’s limited real-time capability compared to sparse methods. It is therefore the objective of this thesis to improve the quality and robustness of the original DTAM algorithm and extend it to a generalized and modular mathematical framework. In particular, the influence of different constancy assumptions and regularizers will be evaluated and tested under various conditions using multiple benchmark data sets.
Structure from Motion (SfM) ist eines der zentralen Probleme im Bereich des maschinellen Sehens und beschäftigt sich mit der Rekonstruktion einer statischen Szene aus den Bilddaten einer einzelnen bewegten Kamera. Das Vorgehen wird dabei typischerweise in zwei sich abwechselnde Schritte unterteilt: In der Tracking-Phase wird zunächst versucht, die Position und Orientierung der Kamera bezüglich eines globalen Koordinatensystems zu bestimmen. Diese Information wird dann in der anschließenden Mapping-Phase dazu verwendet, aus der aktuellen Kameraperspektive eine Tiefenkarte zu erstellen. In der Literatur gibt es bereits eine Vielzahl an lokalen Rekonstruktionsverfahren, die aus ausgewählten Bildmerkmalen dünn-besetzte Punktwolken erzeugen können. Für viele Anwendungsbreiche wie beispielsweise der Robotik oder der Medizin reichen die daraus gewonnenen Informationen jedoch oft nicht aus, weshalb sich die Forschung seit einigen Jahren verstärkt mit dichten Rekonstruktionsmethoden beschäftigt. Mit DTAM (Dense Tracking and Mapping) stellte Newcombe et al. 2011 eines der ersten auf Variationsansätzen beruhende Verfahren zur Bestimmung von dichten Tiefenkarten vor. Da der Algorithmus trotz moderner Hardware auch heute noch nur bedingt echtzeitfähig ist, gab es seitdem verschiedenste Vorschläge zur Optimierung der Geschwindigkeit, jedoch nur wenige zur qualitativen Verbesserung. Ziel dieser Arbeit ist es daher, die Qualität und Robustheit des ursprünglichen DTAM-Ansatzes zu verbessern und die zugrunde liegenden Konzepte in ein generalisiertes und modulares Modell zu übertragen. Dabei wird vor allem der Einfluss verschiedener Konstanzannahmen und Regularisierern untersucht und die Ergebnisse an mehreren Benchmark Datensätzen unter unterschiedlichen Bedingungen getestet.
Enthalten in den Sammlungen:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
thesis.pdf84,08 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repositorium sind urheberrechtlich geschützt.