Datenanalysen für industrielle Anwendungsfälle : Datencharakteristika und Nutzung von Domänenwissen

dc.contributor.advisorMitschang, Bernhard (Prof. Dr.-Ing. habil.)
dc.contributor.authorReimann, Peter
dc.date.accessioned2025-10-17T12:54:41Z
dc.date.issued2025
dc.description.abstractDer inhaltliche Schwerpunkt der vorliegenden Arbeit liegt im Bereich des Datenmanagements sowie der Datenanalyse für industrielle Anwendungsfälle aus dem produzierenden Gewerbe. Die in solchen industriellen Anwendungsfällen verfügbaren Daten weisen komplexe Charakteristika auf, die gängige Verfahren zum Datenmanagement und zur Datenanalyse vor Herausforderungen stellen. Beispiele für solche Datencharakteristika sind, dass häufig nur sehr wenige Daten zur Verfügung stehen oder dass die hohe Produktvielfalt in Unternehmen zu einer höheren Anzahl und Komplexität der in den Daten auftretenden Muster führen kann. In dieser Arbeit werden die häufigsten domänenspezifischen und komplexen Datencharakteristika vorgestellt und kategorisiert. Zudem wird aufgezeigt, dass diese Datencharakteristika, wenn sie nicht adäquat adressiert werden, zu mäßigen Analyseergebnissen führen, z.B. zu einer geringen Vorhersagegenauigkeit in einer Klassifikation. Als weiterer Schwerpunkt wird in dieser Arbeit der Stand der Wissenschaft hinsichtlich grundlegender Ansätze zur Nutzung von formal repräsentiertem Domänenwissen in die drei Schritte Datenakquise, Datenvorbereitung und Datenanalyse von Datenanalyseprozessen untersucht. Es wird diskutiert, inwieweit diese Ansätze die komplexen Datencharakteristika industrieller Anwendungsfälle adressieren können, um somit die Qualität von Analyseergebnissen zu erhöhen. Betrachtete Wissensrepräsentationsformen sind Fallbasen, Regelbasen, Glossare, semantische Netze wie Ontologien oder Wissensgraphen, probabilistische Graphen sowie mathematische Simulationsmodelle. Die untersuchten Ansätze schließen u.a. Ansätze zur Nutzung einer Regelbasis, semantischer Netze oder Simulationsmodelle zum Feature-Engineering, zur Festlegung der Labels in Daten oder für weitere Schritte der Datenakquise, Datenvorbereitung oder der Datenanalyse ein. Die Diskussionen werden mit Evaluationsergebnissen auf Basis realer industrieller Anwendungsfälle und Daten untermauert.de
dc.description.abstractThis thesis focuses on data management and data analysis for industrial use cases in the manufacturing industry. The data available in such industrial use cases has complex characteristics that pose challenges for common methods of data management and data analysis. Examples of such data characteristics are that often only very little data is available or that the high product diversity in companies can lead to a higher number and complexity of patterns occurring in the data. In this thesis, the most common domain-specific and complex data characteristics are presented and categorized. In addition, it is shown that these data characteristics, if not adequately addressed, lead to moderate analysis results, e.g., to a low prediction accuracy in a classification. As a further focus, this thesis examines the state of the art with regard to fundamental approaches that utilize formalized domain knowledge in the three steps of data acquisition, data preparation, and data analysis of data analysis processes. It is discussed to what extent these approaches can address the complex data characteristics of industrial use cases in order to increase the quality of analysis results. The forms of knowledge representation analyzed are case bases, rule bases, glossaries, semantic networks such as ontologies or knowledge graphs, probabilistic graphs and mathematical simulation models. The approaches analyzed include approaches for using a rule base, semantic networks or simulation models for feature engineering, for defining labels in data or for further steps in data acquisition, data preparation or data analysis. The discussions are underpinned by evaluation results based on real industrial use cases and data.en
dc.identifier.other1938824814
dc.identifier.urihttp://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-163920de
dc.identifier.urihttps://elib.uni-stuttgart.de/handle/11682/16392
dc.identifier.urihttps://doi.org/10.18419/opus-16373
dc.language.isode
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subject.ddc004
dc.titleDatenanalysen für industrielle Anwendungsfälle : Datencharakteristika und Nutzung von Domänenwissende
dc.title.alternativeData analyses for industrial use cases : data characteristics and usage of domain knowledgeen
dc.typedoctoralThesis
ubs.dateAccepted2025-04-09
ubs.fakultaetInformatik, Elektrotechnik und Informationstechnik
ubs.institutInstitut für Parallele und Verteilte Systeme
ubs.publikation.seiten256
ubs.publikation.typHabilitation
ubs.thesis.grantorInformatik, Elektrotechnik und Informationstechnik
ubs.unilizenzOK

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Habilitation_Peter_Reimann_publication_2025_05_16.pdf
Size:
4.24 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.3 KB
Format:
Item-specific license agreed upon to submission
Description: