Automatic classification of abstractness in English rigid nouns

Saponaro, Alberto

Automatic classification of abstractness in English rigid nouns

Files

Automatic_Classification_of_Abstractness_in_English_Rigid_Nouns_BA_Saponaro.pdf (875.29 KB)

Date

2023

Authors

Saponaro, Alberto

Abstract

The main difference between (i) Mass-Count Languages (such as English) and (ii)Classifiers Languages (such as Chinese) is that (i) encode the information about nouns’ countability in their grammar and (ii) employ a classification system of classifiers to distinguish between individuals or substance. If the mass-count distinction is a characteristic of mass-count language, the substance-individuals denotation seems to be a concept universally available for all humans. Another concept that appears to be universally accessible and linked to the countability status of English nouns is the notion of abstractness. Then, mass nouns usually refer to an abstract object, and this is confirmed from the distribution of abstractness in the dataset. This thesis’ objective is to provide a model for the classification of rigid nouns (count or mass only) that is capable to generalize on the degree of abstractness. Additionally, it tests if a model trained with the same set of features is capable of rating the abstractness of those nouns. To accomplish these tasks, several sets of features are being identified based on syntactic and semantic properties of nouns that describe the mass-count distinction. The results indicate that the first model M1, a mass-count classifier that predicts the countability class of a rigid noun, provides reliable predictions and can generalize on the degree of abstractness of the targets. The second model M2, an abstractness rate predictor that assigns an abstractness rate from 1 to 5 to a rigid noun, is incapable of providing reliable ratings and cannot generalize on the countability status of the targets. A third model M3, an abstract-concrete (binary) classifier that predicts the abstractness class of a rigid noun, provides reliable predictions and can generalize on the countability status of the targets. Given that those results concerns rigid nouns only, further research can be conducted by examining the abstractness of elastic nouns. However, there is the need of an annotation that rates abstractness of nouns senses.

Der Hauptunterschied zwischen (i) Mass-Count Sprachen (wie Englisch) und (ii) Klassifizierer Sprachen (wie Chinesisch) besteht darin, dass (i) die Information über die Zählbarkeit der Nomen in ihrer Grammatik codieren und (ii) ein System von Klassifikatoren verwenden, um zwischen Individuen und Substanz zu unterscheiden. Wenn der Mass-Count Distinktion eine Eigenschaft von Mass-Count Sprachen ist, die Individuen-Substanz Denotation scheint ein Konzept zu sein, das allen Menschen universell zugänglich ist. Ein weiteres Konzept, der universell zugänglich zu sein scheint und mit dem Zählbarkeitsstatus englischer Nomen verbunden ist, ist das Konzept der Abstraktheit. Massennomen beziehen sich normalerweise auf abstrakte Objekte, und dies wird durch die Verteilung der Abstraktheit in dem Datensatz bestätigt. Das Ziel der Thesis ist, ein Modell für die Klassifizierung von starren Nomen (nur Masse oder Zählbar) bereitzustellen, das in der Lage ist, auf den Abstraktheitsgrad zu generalisieren. Ebenso wird getestet, ob ein Model, das mit demselben Featuressatz trainiert wurde, in der Lage ist, den Abstraktheitsgrad dieser Nomen zu bewerten. Um diese Aufgabe zu erfüllen, wurden mehrere Featuressätze identifiziert, die auf syntaktischen und semantischen Eigenschaften von Nomen basieren, die die Mass-Count Distinktion beschreiben. Die Ergebnisse zeigen, dass das erste Modell M1, ein Mass-Count Klassifikator, der die Zählbarkreisklassen eines starren Nomens vorhergesagt, zuverlässige Vorhersagen liefert und auf den Abstraktheitsgrad der Ziele generalisieren kann. Das zweite Modell M2, ein Abstraktheitsbewertung Prädiktor, der einem starren Nomen eine Abstraktheitsbewertung von 1 bis 5 zuweist, ist nicht in der Lage, zuverlässige Bewertungen zu liefern und kann nicht auf den Vorhersagt, liefert zuverlässige und kann auf den Zählbarkeitsstatus der Ziele generalisieren. Ein drittes Modell M3, ein Abstrakt-Konkret Klassifikator, der die Abstraktheitsklasse eines starren Nomens vorhersagt, liefert zuverlässige Vorhersagen und kann auf den Zählbarkeitsstatus der Ziele generalisieren. Da diese Ergebnisse nur starre Nomen betreffen, können weitere Untersuchungen durchgeführt werden, indem die Abstraktheit elastischer Nomen untersucht wird. Allerdings besteht die Notwendigkeit einer Annotation, die den Abstraktheitsgrad von Nomen-Sinnen bewertet.

URI

http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-142534
http://elib.uni-stuttgart.de/handle/11682/14253
http://dx.doi.org/10.18419/opus-14234

Collections

05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Full item page

Automatic classification of abstractness in English rigid nouns

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By