Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.18419/opus-13827
Autor(en): Wemmer, Eileen
Titel: Progressions of emotion annotations in conversations and dreams for emotion analysis
Erscheinungsdatum: 2023
Dokumentart: Abschlussarbeit (Master)
Seiten: 108
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-138461
http://elib.uni-stuttgart.de/handle/11682/13846
http://dx.doi.org/10.18419/opus-13827
Zusammenfassung: Emotion Analysis describes the field of study concerned with the extraction of explicit emotional content implicitly contained in text. To this end, supervised machine learning approaches are commonly employed which rely on annotated data for training and evaluation. This data dictates the tasks trained models will be able to solve and as a consequence, multiple corpora containing emotion annotations have been gathered in the past. These corpora commonly vary in multiple ways, including their underlying domain, the scope of each annotation, and whether they feature emotion representations in terms of categories or their position in a vector space spanned by interpretable dimensions. However, to the best of our knowledge, none of the previously gathered corpora allow for a fine-grained analysis and prediction of the progression of emotional content over the course of texts. While sequential annotations representing the emotional content of each part a text is comprised of exist, they usually only pertain to the parts they are attached to and do therefore not accurately reflect the current emotions expressed in the overall text at this point. Similarly, contextualized annotations that take into account the previous content of a text exist, yet they are not gathered in sequences and therefore also don’t allow for the analysis of the changes in emotional content. This thesis aims to close that gap by gathering progressional labels, that are both sequential and contextualized by the previous text, through a novel, incremental annotation task. In a crowdsourcing setup, texts are revealed to annotators part-by-part and they are asked to annotate the emotional content in terms of categorical labels and appraisal dimensions up to the current point. This yields a set of sequential labels that represent the development of emotional content up to the part of the text they are assigned to. We gather progression annotations for both dream reports and customer service dialogues and find the novel incremental annotation setup to be suitable for their collection. Analyses of the data show that changing progressions exist in both domains, though they are more varied for dream reports than for customer service dialogues in terms of how often annotations change throughout one instance. We do not uncover any clear tendencies in progressions for either domain, implying a rich variation in changes between instances. Leveraging the gathered data to study the degree to which simple sequential models are able to learn to make use of this progressional information, we show a consistent increase in performance for models trained on intact categorical progressions that is too small to be conclusive. This motivates further research, as experiments with stronger baseline systems could help get clearer insights into the matter.
Das Forschungsgebiet der Emotionsanalyse beschäftigt sich mit der Extraktion expliziter emotionaler Inhalte, welche implizit in Texten zum Ausdruck gebracht werden. Hierfür werden in der Regel überwachte maschinelle Lernverfahren eingesetzt. Ihr Training und ihre Beurteilung basieren auf annotierten Daten. Diese Daten schränken ein, welche Aufgaben trainierte Modelle lösen können. Entsprechend wurden in der Vergangenheit zahlreiche Korpora mit Emotionsannotationen gesammelt. Diese unterscheiden sich in vielerlei Hinsicht, wie der zugrundeliegenden Domäne, der Granularität der einzelnen Annotationen sowie darin, ob sie Emotionen in Form von Kategorien oder deren Position in einem Vektorraum mit interpretierbaren Dimensionen darstellen. Nach unserem Kenntnisstand erlaubt jedoch keiner der bisher gesammelten Korpora eine Analyse und Vorhersage des Verlaufs emotionaler Inhalte in Texten. Zwar existieren sequentielle Annotationen, welche jeweils den emotionalen Inhalt jedes Teils des Textes wiederspiegeln, jedoch beziehen sich diese in der Regel nur auf eben den Teil, welchem sie zugeordnet sind. Entsprechend spiegeln sie nicht die Emotionen wider, welche der Gesamttext bis zu diesem Punkt ausdrückt. Ähnlich verhält es sich mit kontextualisierten Annotationen, welche zwar den vorhergehenden Text berücksichtigen, aber welche bislang nicht in als sequentielle Annotationen gesammelt wurden. Das Ziel dieser Arbeit ist es, diese Lücke zu schließen. Hierzu werden durch ein neuartiges, inkrementelles Vorgehen Annotationen durch Crowdsourcing gesammelt, welche sowohl sequentiell den emotionalen Inhalt des Textes für jeden Teil widerspiegeln, als auch den Kontext des vorangehenden Textes berücksichtigen. Hierbei werden den Annotatoren Texte nach und nach offenbart und sie werden gebeten, den emotionalen Inhalt bis zum aktuellen Punkt zu beschreiben - sowohl durch Kategorien als auch durch Ordinalwerte entlang kognitiver Bewertungsdimensionen (Appraisals). Daraus ergibt sich eine Menge sequentieller Annotationen, welche jeweils den emotionalen Inhalts des gesamten Textes bis zu jenem Teil darstellen, dem sie zugeordnet sind. Annotationen werden hierfür sowohl für Traumberichte als auch für Kundendienstdialoge gesammelt. Die Analyse der Daten zeigt, dass sich in beiden Domänen im Verlaufe der Texte Änderungen in den emotionalen Inhalten ergeben, wobei diese bei Traumberichten häufiger auftreten als bei Kundendienstdialogen. Eindeutigen Tendenzen konnten in den Verläufen beider Domänen nicht gefunden werden. Dies deutet darauf hin, dass die Verläufe zwischen den einzelnen Texten variieren. Anschließend nutzen wir die gesammelten Daten um zu untersuchen, inwieweit einfache sequenzielle Modelle diese Verlaufsinformationen nutzen und vorhersagen können. Unsere Ergebnisse zeigen eine konsistente Leistungssteigerung für Modelle, welche während des Trainings Zugriff auf den korrekten Verlauf von Emotionen hatte gegenüber solchen, die dies nicht hatten, welcher jedoch zu klein für eine eindeutige Interpretation ist. Zukünftige Experimente mit stärkeren Modellen könnten hier für mehr Klarheit sorgen.
Enthalten in den Sammlungen:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
thesis_wemmer.pdf3,46 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repositorium sind urheberrechtlich geschützt.