Einfluss von Bildausschnittgröße und Hyperparametern auf Computer Vision Modelle

dc.contributor.authorLekar, Dominik
dc.date.accessioned2023-08-16T09:55:39Z
dc.date.available2023-08-16T09:55:39Z
dc.date.issued2023de
dc.description.abstractLange Zeit galten faltende neuronale Netze (CNN) als Stand der Technik in vielen Aufgabengebieten der Computer Vision, wie beispielsweise der Bildklassifizierung. Dank technischem Fortschritt konnten sich jedoch in den letzten Jahren auch andere Computer Vision Modelle etablieren. Insbesondere Vision Transformer(ViT) und mehrschichtige Perzeptron(MLP) Modelle verarbeiten die Bilder in Bildausschnitten. Häufig wird in Arbeiten jedoch nur entweder eine Größe mit unterschiedlichen Hyperparametern, oder aber mehrere Ausschnittsgrößen mit denselben Parametern evaluiert. Auf diese Weise lassen sich keine Rückschlüsse ziehen, welche Wechselwirkungen zwischen unterschiedlichen Ausschnittsgrößen und anderen Hyperparametern bestehen. Diese Arbeit beschäftigt sich daher mit der Untersuchung ebendieser Wechselwirkungen. Hierbei wird ein Framework implementiert, mit dem sich eine automatisierte Evaluierung durchführen lässt. In jedem Trainingsdurchlauf wird der Wert eines Hyperparameters gleichmäßig variiert und mit mehreren Ausschnittsgrößen evaluiert. Untersucht werden neben der Genauigkeit des Modells auch Laufzeit und Speicherbedarf des Trainingsprozesses. Die Ergebnisse werden anhand eines Beispieldatensatzes vorgestellt und anschließend für jeden der evaluierten Hyperparameter zu einem Wert zusammengefasst, der sich anschließend mit den Werten der restlichen Ausschnittsgrößen vergleichen lässt. Dabei kann gezeigt werden, dass sich Hyperparameter in manchen Situationen durchaus unterschiedlich auf andere Ausschnittsgrößen auswirken, es jedoch häufig schwierig ist allgemeine Schlüsse zu ziehen.de
dc.identifier.other1856767159
dc.identifier.urihttp://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-134448de
dc.identifier.urihttp://elib.uni-stuttgart.de/handle/11682/13444
dc.identifier.urihttp://dx.doi.org/10.18419/opus-13425
dc.language.isodede
dc.rightsinfo:eu-repo/semantics/openAccessde
dc.subject.ddc004de
dc.titleEinfluss von Bildausschnittgröße und Hyperparametern auf Computer Vision Modellede
dc.typemasterThesisde
ubs.fakultaetInformatik, Elektrotechnik und Informationstechnikde
ubs.institutInstitut für Visualisierung und Interaktive Systemede
ubs.publikation.seiten60de
ubs.publikation.typAbschlussarbeit (Master)de

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Lekar_Dominik.pdf
Size:
4.11 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.3 KB
Format:
Item-specific license agreed upon to submission
Description: