Komputationelle Analyse der Bedeutungsaspekte von „nur“
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Der deutsche Partikel „nur“ kann unterschiedliche semantische Bedeutungen haben, wie verschiedene linguistische Untersuchungen zeigen. Aus diesen kann die These abgeleitet werden, dass wahrheitskonditionale Bedeutung, evaluative Bedeutung und Konnektorbedeutung als drei zu unterscheidende Bedeutungen von „nur“ auftreten. Die evaluative Bedeutung kann zudem in Stärke und Art variieren. Ausgedrückt werden kann, dass das durch „nur“ Eingeschlossene als zu wenig empfunden wird und, dass diese Wenigkeit als schlecht empfunden wird. Die wahrheitskonditionale Bedeutung ist entweder vorhanden oder nicht relevant. Welche syntaktischen und semantischen Gegebenheiten die unterschiedlichen Bedeutungen hevorrufen, verstärken oder begünstigen, wird in dieser Arbeit untersucht. Durch die Analyse der Embeddings von „nur“- sowie CLS-Tokens bezüglich ihrer Verteilung im Vektorraum können hier unterschiedliche Bedeutungen nachgewiesen werden. Die Token-Embeddings zweier großer Sprachmodelle, GBert Large und GElectra Large, aus jeweils unterschiedlichen Schichten, wurden hier erstellt und mit PCA auf zwei Dimensionen reduziert, grafisch dargestellt und verglichen. In diesem Vergleich, verbunden mit einer menschlichen Annotation der Bedeutungsdimensionen der jeweiligen Sätze und Teilsätze, zeigen sich Zusammenhänge zwischen der Bedeutung von „nur“ und anderen Satzmerkmalen: So zeigt meine Arbeit, dass die Position von „nur“ innerhalb des Satzes Auswirkung auf die Bedeutung hat. Zudem hängt die Skalarität mit Vorkommen und Art der evaluativen Bedeutung zusammen. Evaluative Bedeutung kann wertend die Wenigkeit („little-/so-wenig-Bedeutung“) oder auch die Schlechtigkeit/den geringen Wert („bad-/so-schlecht-Bedeutung“) tragen. Die negativierte Verwendung von „nur“ führt zu einer nicht-evaluativen Bedeutung. Auch wird mit meiner Untersuchung belegt, dass beide verwendeten Modelle die Konnektorbedeutung erkennen und klar von den anderen Bedeutungen unterscheiden. Meine Erkenntnisse können als Grundlage zur Verbesserung der Vorhersage einer evaluative Bedeutung von „nur“ dienen und tragen zum besseren Verständnis der Semantik und Pragmatik von Sätzen mit „nur“ bei.
Several linguistic studies found that the German particle "nur" can have various semantic meanings. The findings indicate that truth-conditional, evaluative and connector meaning are three possible distinctions in the meaning of "nur". Furthermore, the type and intensity of the evaluative meaning can vary. It can express that the phrase referenced by "nur" is perceived as "too little" and that this paucity is perceived as bad. The truth-conditional meaning can be either existent or irrelevant. The following work investigates which syntactic and semantic factors induce or intensify the different meanings. Different meanings of "nur" can be established by analyzing the embeddings of "nur" and CLS tokens with respect to their distribution in the vector space. The token embeddings of two large german language models GBert Large and GElectra Large using different layers in each case were created, reduced to two dimensions, represented graphically and compared. The comparison in combination with human annotation of the meaning dimensions of the respective sentences and clauses shows a relationship between the meaning of "nur" and other sentence features: My work shows that the position of "nur" within a sentence has an impact on the meaning. Moreover, the scalarity is linked the occurrene and type of evaluative meaning. Evaluative meaning can carry the meaning of pauctiy ("so little" meaning) or badness/low value ("so bad" meaning). The negative use of "nur" causes a non-evaluative meaning. My study also gives evidence that both of the used models are able to recognize and clearly differentiate connector meaning from the other meanings of "nur". These findings can form a basis to improve the prediction of evaluative meaning of "nur" and contribute to a better understanding of the semantics and pragmatics of sentences containing "nur".