Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.18419/opus-13425
Autor(en): Lekar, Dominik
Titel: Einfluss von Bildausschnittgröße und Hyperparametern auf Computer Vision Modelle
Erscheinungsdatum: 2023
Dokumentart: Abschlussarbeit (Master)
Seiten: 60
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-134448
http://elib.uni-stuttgart.de/handle/11682/13444
http://dx.doi.org/10.18419/opus-13425
Zusammenfassung: Lange Zeit galten faltende neuronale Netze (CNN) als Stand der Technik in vielen Aufgabengebieten der Computer Vision, wie beispielsweise der Bildklassifizierung. Dank technischem Fortschritt konnten sich jedoch in den letzten Jahren auch andere Computer Vision Modelle etablieren. Insbesondere Vision Transformer(ViT) und mehrschichtige Perzeptron(MLP) Modelle verarbeiten die Bilder in Bildausschnitten. Häufig wird in Arbeiten jedoch nur entweder eine Größe mit unterschiedlichen Hyperparametern, oder aber mehrere Ausschnittsgrößen mit denselben Parametern evaluiert. Auf diese Weise lassen sich keine Rückschlüsse ziehen, welche Wechselwirkungen zwischen unterschiedlichen Ausschnittsgrößen und anderen Hyperparametern bestehen. Diese Arbeit beschäftigt sich daher mit der Untersuchung ebendieser Wechselwirkungen. Hierbei wird ein Framework implementiert, mit dem sich eine automatisierte Evaluierung durchführen lässt. In jedem Trainingsdurchlauf wird der Wert eines Hyperparameters gleichmäßig variiert und mit mehreren Ausschnittsgrößen evaluiert. Untersucht werden neben der Genauigkeit des Modells auch Laufzeit und Speicherbedarf des Trainingsprozesses. Die Ergebnisse werden anhand eines Beispieldatensatzes vorgestellt und anschließend für jeden der evaluierten Hyperparameter zu einem Wert zusammengefasst, der sich anschließend mit den Werten der restlichen Ausschnittsgrößen vergleichen lässt. Dabei kann gezeigt werden, dass sich Hyperparameter in manchen Situationen durchaus unterschiedlich auf andere Ausschnittsgrößen auswirken, es jedoch häufig schwierig ist allgemeine Schlüsse zu ziehen.
Enthalten in den Sammlungen:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
Lekar_Dominik.pdf4,21 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repositorium sind urheberrechtlich geschützt.