Historical word sense clustering with deep contextualized word embeddings

Thumbnail Image

Date

2020

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Models of word sense clustering have mainly been explored on synchronous, modern data. In contrast to these synchronous data sets, various historical word sense clustering data sets have been developed. This enables the evaluation of word sense disambiguation models on historical corpora and the exploration of their potential to detect changes in clusters over time (lexical semantic change). The aim of this thesis is to assess multiple context-based approaches to word sense disambiguation and lexical semantic change detection by relying on deep contextualized word embeddings and powerful token-based vector space models.


Modelle zum Clustern von Wortbedeutungen wurden bislang hauptsächlich auf synchrone, moderne Daten angewandt. Mittlerweile stehen der Forschung auch verschiedene historische Datensätze zur Verfügung. Dies ermöglicht die Evaluierung verschiedener Modelle zur Disambiguierung von Wortbedeutungen und die Erforschung ihres Potenzials, diachrone Veränderungen in den Clustern zu erkennen (lexikalische semantische Veränderungen). Ziel dieser Arbeit ist es, kontextbasierte Ansätze zur Disambiguierung von Wortbedeutungen zu vergleichen und ihr Potenzial zur Erkennung lexikalischer, semantischer Veränderungen zu bewerten. Die Evaluierung erfolgt unter der Verwendung von stark kontextualisierten Worteinbettungen und tokenbasierten Verktorraummodellen.

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By