Automatische Ressourcenselektion in Datenanalysepipelines
Date
2019
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
In dieser Ausarbeitung werden ein Konzept sowie eine prototypische Implementierung für die automatische Relevanzbestimmung von semantischen Ressourcen zu den Eingabedaten von Datenanalysen vorgestellt. Dabei werden die einzelnen Pipelineschritte einer Datenanalysepipeline gesondert betrachtet. Zum Einsatz kommen Methoden und Metriken aus dem Information Retrieval. Durch die Anwendung des Prototyps auf beispielhafte Datenanalysepipelines und semantische Ressourcen wird der praktikable Nutzen der vorgeschlagenen Methode evaluiert. Hierzu werden die Relevanzen zu den Beispieldaten und Pipelineschritten bestimmt und durch die Integration der semantischen Ressourcen die Veränderung der Datenanalyseergebnisse beobachtet und diskutiert.