Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.18419/opus-13105
Langanzeige der Metadaten
DC ElementWertSprache
dc.contributor.authorReed, Connor-
dc.date.accessioned2023-06-01T10:40:06Z-
dc.date.available2023-06-01T10:40:06Z-
dc.date.issued2023de
dc.identifier.other1847654711-
dc.identifier.urihttp://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-131244de
dc.identifier.urihttp://elib.uni-stuttgart.de/handle/11682/13124-
dc.identifier.urihttp://dx.doi.org/10.18419/opus-13105-
dc.description.abstractThis work explores the field of Automated Machine Learning (AutoML) and its application in unsupervised learning, specifically clustering. While AutoML for clustering systems exist, none of these fully integrate and analyze preprocessing steps. Therefore the contributions of this work include the following: Analysis and selection of promising preprocessing methods. The selection is based on supervised AutoML systems with preprocessing and clustering use-cases. Extension of the existing package AutoML4Clust with the selected preprocessing methods and their respective hyperparameters. Addition of categorical clustering algorithms to the search space in an attempt to improve results on data with categorical features. Implementation of multiobjective optimization strategies which aim to reach a trade-off between accuracy and runtime. Reduction in runtime with sampling, which optimizes on only a subset of the data. Rigorous evaluation of the new implementations. The work concludes that AutoML can significantly benefit from the addition of preprocessing and that the proposed methods show promising results for future development.en
dc.description.abstractDiese Arbeit erforscht das Gebiet des automatisierten maschinellen Lernens (AutoML) und seine Anwendung in unüberwachtem Lernen, insbesondere Clustering. Es gibt zwar AutoML für Clustering Systeme, aber keines von ihnen integriert und analysiert Vorverarbeitungsschritte systematisch. Daher umfasst der Beitrag dieser Arbeit Folgendes: Analyse und Auswahl von vielversprechenden Vorverarbeitungsmethoden. Die Auswahl basiert auf überwachten AutoML-Systemen mit Preprocessing und auf Clustering Anwendungsfällen. Erweiterung des bestehenden Pakets AutoML4Clust um die ausgewählten Preprocessing-Methoden und ihre jeweiligen Hyperparameter. Hinzufügen von kategorischen Clustering-Algorithmen zum Suchraum, um die Ergebnisse bei Daten mit kategorischen Merkmalen zu verbessern. Implementierung von Multiobjective Optimierungsstrategien, die einen Kompromiss zwischen Genauigkeit und Laufzeit anstreben. Reduzierung der Laufzeit durch Sampling, bei dem nur auf einer Teilmenge der Daten optimiert wird. Rigorose Evaluierung der neuen Implementierungen. Die Arbeit kommt zu dem Schluss, dass AutoML von der Hinzufügung von Vorverarbeitungsmethoden stark profitieren kann und dass die vorgeschlagenen Methoden vielversprechende Ergebnisse für die zukünftige Entwicklung zeigen.de
dc.language.isoende
dc.rightsinfo:eu-repo/semantics/openAccessde
dc.subject.ddc004de
dc.titleAnalysis and integration of data preprocessing steps in AutoML for clusteringen
dc.title.alternativeAnalyse und Integration von Datenvorverarbeitungsschritten in AutoML für Clusteringde
dc.typebachelorThesisde
ubs.fakultaetInformatik, Elektrotechnik und Informationstechnikde
ubs.institutInstitut für Parallele und Verteilte Systemede
ubs.publikation.seiten76de
ubs.publikation.typAbschlussarbeit (Bachelor)de
Enthalten in den Sammlungen:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
BachelorThesis_Connor_Reed.pdf980,76 kBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repositorium sind urheberrechtlich geschützt.