Please use this identifier to cite or link to this item: http://dx.doi.org/10.18419/opus-10468
Authors: Voggesberger, Julius
Title: Evaluation von Zwischenergebnissen in Entscheidungsbäumen
Issue Date: 2019
metadata.ubs.publikation.typ: Abschlussarbeit (Bachelor)
metadata.ubs.publikation.seiten: 88
URI: http://elib.uni-stuttgart.de/handle/11682/10485
http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-104851
http://dx.doi.org/10.18419/opus-10468
Abstract: Durch Technologien wie das Internet der Dinge und die Industrie 4.0 steigt die Menge an Daten auf der Welt rasant an. Klassifikationsalgorithmen werden von Analysten verwendet, um diese Menge an Daten zu analysieren. Eine Gruppe der populärsten Klassifikationsalgorithmen sind Entscheidungsbaumalgorithmen. Diese stellen erlernte Modelle menschenverständlich als einen Baum dar. Durch die steigende Menge an Daten kann es jedoch vorkommen, dass die erstellten Bäume immer größer, komplexer und unverständlicher für Analysten werden. Häufig werden die Bäume nachdem sie erstellt wurden gestutzt, um sie so kleiner und verständlicher zu machen. Methoden, die die Bäume nach der Erstellung kürzen, werden Post-Pruning-Methoden genannt. Jedoch benötigen Post-Pruning-Methoden eine hohe Laufzeit, da der Entscheidungsbaum erst komplett erstellt werden muss, ehe er gekürzt werden kann. Eine wenig erforschte Alternative sind Methoden, die während der Erstellung des Entscheidungsbaumes diesen kürzen. Diese Methoden werden auch Pre-Pruning-Methoden genannt. In dieser Arbeit wird ein Verfahren vorgestellt, mit dem Pre-Pruning-Methoden allgemeingültig auf Entscheidungsbäume der Familie der Top-Down Induction of Decision Trees angewendet werden können. Viele Pre-Pruning-Methoden benötigen Schwellenwerte. Aus diesem Grund wurde weiterhin ein Ansatz entwickelt, der es einem Analysten ermöglicht für eine gewünschte Baumqualität einen Schwellenwert für die Pre-Pruning-Methoden zu erhalten. Dieser Ansatz soll es ermöglichen, die Pre-Pruning-Methoden evaluieren zu können. Eine Evaluation mithilfe dieses Ansatzes zeigt, dass hohe Laufzeiteinsparungen mithilfe der Pre-Pruning-Methoden möglich sind. Es konnten jedoch keine zuverlässigen Aussagen hinsichtlich der Qualität der Pre-Pruning-Methoden getroffen werden. Weitere Forschung hinsichtlich der Einflüsse von Datensätzen auf diese Methoden ist nötig, um zuverlässige Aussagen über die Qualität der Methoden treffen zu können.
Appears in Collections:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Files in This Item:
File Description SizeFormat 
JuliusVoggesberger_EvaluationVonZwischenergebnissenInEntscheidungsbäumen_final.pdf3,86 MBAdobe PDFView/Open


Items in OPUS are protected by copyright, with all rights reserved, unless otherwise indicated.