Please use this identifier to cite or link to this item: http://dx.doi.org/10.18419/opus-11541
Authors: Kurtyigit, Sinan
Title: Lexical semantic change discovery
Issue Date: 2021
metadata.ubs.publikation.typ: Abschlussarbeit (Bachelor)
metadata.ubs.publikation.seiten: 47
URI: http://elib.uni-stuttgart.de/handle/11682/11558
http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-115583
http://dx.doi.org/10.18419/opus-11541
Abstract: The field of Lexical Semantic Change Detection (LSCD) deals with the detection of words that change their meaning over time. While there is a large amount of research in the field, only few go beyond a standard benchmark evaluation of existing models. The goal of this thesis is to derive a practical benefit from previous milestones in research. Therefore, a framework is built, that utilizes common approaches for LSCD to discover novel changing words. The framework is highly automated and easily applicable, making it useful for both beginners and experienced users. Anyone, who has access to two corpora (e.g., from different time periods) can use this framework to automatically discover words that change their meaning between the two corpora. In an exemplary discovery process, which includes multiple fine-tuning phases on common tasks, the framework and its underlying discovery process are demonstrated. The framework is successfully used to discover changing words between two time-specific German corpora. Additionally, in the fine-tuning phases the framework is also used to evaluate and optimize the implemented approaches and model parameters. The results show that the framework provided in this thesis and its implemented approaches can be used for the discovery of novel changing words and also evaluation.
Das Gebiet LSCD (Lexical Semantic Change Detection) beschäftigt sich mit der Erkennung von Wörtern, die ihre Bedeutung im Laufe der Zeit ändern. Es gibt zwar eine große Anzahl an Forschungsarbeiten auf diesem Gebiet, aber nur wenige gehen über eine Standard-Benchmark-Evaluation bestehender Modelle hinaus. Das Ziel dieser Arbeit ist es, aus den bisherigen Meilensteinen der Forschung einen praktischen Nutzen abzuleiten. Dazu wird ein Framework erstellt, das gängige Ansätze für LSCD nutzt, um Wörter zu entdecken die einen Bedeutungswandel durchmachen. Das Framework ist hochgradig automatisiert und leicht anwendbar, wodurch es sowohl für Anfänger als auch für erfahrene Benutzer nützlich ist. Jeder, der Zugriff auf zwei Korpora (z.B. aus unterschiedlichen Zeiträumen) hat, kann dieses Framework nutzen, um automatisch Wörter zu entdecken, die ihre Bedeutung zwischen den beiden Korpora ändern. In einem exemplarischen Entdeckungsprozess, der mehrere Feinabstimmungsphasen beinhaltet, wird das Framework und der zugrundeliegende Entdeckungsprozess demonstriert. Das Framework wird erfolgreich genutzt um Wörter zu entdecken die einen Bedeutungswandel zwischen zwei deutschen zeitspezifischen Korpora durchmachen. Zusätzlich wird das Framework in den Feinabstimmungssphasen auch zur Evaluierung und Optimierung der implementierten Ansätze und Modellparameter eingesetzt. Die Ergebnisse zeigen, dass das in dieser Arbeit vorgestellte Framework und seine implementierten Ansätze sowohl für die Entdeckung von Wörtern die einen Bedeutungswandel durchmachen als auch für die Evaluation verwendet werden können.
Appears in Collections:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Files in This Item:
File Description SizeFormat 
Kurtyigit_Thesis_LSCDiscovery.pdf7,2 MBAdobe PDFView/Open


Items in OPUS are protected by copyright, with all rights reserved, unless otherwise indicated.