Low resource NLP for polysynthetic languages : morphological segmentation and machine translation

dc.contributor.advisorVu, Ngoc Thang (Prof. Dr.)
dc.contributor.authorMager Hois, Jesus Manuel
dc.date.accessioned2025-01-13T13:50:39Z
dc.date.available2025-01-13T13:50:39Z
dc.date.issued2024de
dc.description.abstractThis thesis explores the application of Natural Language Processing (NLP) techniques to morphologically rich indigenous languages of the Americas, focusing on low-resource scenarios. The work addresses the challenges of modeling morphological segmentation and machine translation for these languages, often lacking large annotated datasets and facing issues like code-switching and orthographic normalization. Contributions include the development of new datasets, the adaptation of neural network models for specific tasks, and the investigation of the impact of morphological segmentation on machine translation performance. Additionally, the thesis delves into the ethical implications of applying NLP technologies to these languages, considering the perspectives of native speakers and community leaders.en
dc.description.abstractDiese Dissertation untersucht die Anwendung von Techniken der Verarbeitung natürlicher Sprache (NLP) auf morphologisch reiche indigene Sprachen Amerikas, mit Fokus auf Szenarien mit begrenzten Ressourcen. Die Arbeit befasst sich mit den Herausforderungen der Modellierung morphologischer Segmentierung und maschineller Übersetzung für diese Sprachen, denen oft umfangreiche annotierte Datensätze fehlen und die mit Problemen wie Code-Switching und orthografischer Normalisierung konfrontiert sind. Zu den Beiträgen gehören die Entwicklung neuer Datensätze, die Anpassung neuronaler Netzwerkmodelle für spezifische Aufgaben und die Untersuchung der Auswirkungen morphologischer Segmentierung auf die Leistung maschineller Übersetzung. Darüber hinaus geht die Dissertation auf die ethischen Implikationen der Anwendung von NLP-Technologien auf diese Sprachen ein und berücksichtigt dabei die Perspektiven von Muttersprachlern und Gemeindeführern.de
dc.identifier.other1914492706
dc.identifier.urihttp://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-155200de
dc.identifier.urihttp://elib.uni-stuttgart.de/handle/11682/15520
dc.identifier.urihttps://doi.org/10.18419/opus-15501
dc.language.isoende
dc.rightsinfo:eu-repo/semantics/openAccessde
dc.subject.ddc004de
dc.titleLow resource NLP for polysynthetic languages : morphological segmentation and machine translationen
dc.typedoctoralThesisde
ubs.dateAccepted2024-02-16
ubs.fakultaetInformatik, Elektrotechnik und Informationstechnikde
ubs.institutInstitut für Maschinelle Sprachverarbeitungde
ubs.publikation.seitenxiii, 206de
ubs.publikation.typDissertationde
ubs.thesis.grantorInformatik, Elektrotechnik und Informationstechnikde

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Dr_Thesis_Low_Resource NLP for_Polysynthetic_Languages.pdf
Size:
3.86 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.3 KB
Format:
Item-specific license agreed upon to submission
Description: