Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.18419/opus-12289
Autor(en): Ehlers, Lena
Titel: Extraktion von Figurenauf- und -abtritten aus XML-codierten Dramatexten
Sonstige Titel: Extractions of character appearances and exits from XML-encoded dramatic texts
Erscheinungsdatum: 2022
Dokumentart: Abschlussarbeit (Bachelor)
Seiten: 60
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-123064
http://elib.uni-stuttgart.de/handle/11682/12306
http://dx.doi.org/10.18419/opus-12289
Zusammenfassung: Dem Nebentext von Dramentexten, zu dem auch Regieanweisungen zählen, ist in der Forschung bislang noch wenig Beachtung geschenkt worden. Vorliegende Arbeit stellt einen regelbasierten Algorithmus vor, mit dem ermittelt wird, ob in den Regieanweisungen XML-kodierter deutscher Dramentexte ein Figurenauf- oder -abtritt vorliegt und welche Figuren ggf. davon betroffen sind. Die extrahierten Informationen werden dann automatisch der XML-Kodierung des Dramentextes hinzugefügt. Die bisherigen Evaluationsdaten zeigen ein Makrobewertungs-F1-Maß von über 92% für die Klassifikation in Figurenauf- und -abtritt und über 85% für die korrekte Figurenerkennung. Demnach eignet sich der in dieser Arbeit vorgestellte Algorithmus für die Anreicherung der XML-kodierten Dramentexte und kann damit als Grundlage für weitergehende Analysen, wie die Kopräsenz von Figuren, genutzt werden.
Enthalten in den Sammlungen:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
Bachelorthesis_LenaEhlers.pdf422,87 kBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repositorium sind urheberrechtlich geschützt.