Textvorverarbeitung zur deutschen Version des Festival Text-to-Speech Synthese Systems
Files
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Im Rahmen einer Studienarbeit sollte eine Textvorverarbeitungskomponente fuer das Multilinguale Sprachsynthesesystem FESTIVAL entwickelt werden. Unter anderem wurden Verfahren zur Erkennung und Expansion verschiedener Zahlenformate, Abkuerzungenund Sonderzeichen implementiert. Des weiteren wurden Ueberlegungen zur Anbindung einer morphosyntaktischen Komponente angestellt, die in einer weiteren Studien- oder Diplomarbeit vollzogen werden soll. Inhalt: Einfuehrung, Was ist Text-to-Speech Synthese?, Wozu Text-to-Speech Synthese?, Aufbau eines TTS-Systems, Die Textvorverarbeitung, linguistische Verarbeitung, Synthese, Das Festival Speech Synthese System, Die Benutzung von Festival, Die Aeusserungen in Festival, Die Module in Festival, Initialisierung, Tokenisierung, Token POS, Token-to-Word Regeln, POS Tagging, Phrasierung, Lexikon-Lookup, Intonation 1, Dauer, Intonation 2, Synthese, Die Werkzeuge von Festival, Erweiterung der CART trees, Erweiterung des Festival-Regex-Tools, Festival-Regex: string-matches, Die Erweiterung: pattern-matches, Die deutsche Textvorverarbeitung in Festival, Aufsplittung von Zusammensetzungen, Expansion von Zahlen, Brueche, Verhaeltniszahlen, Telefonnummern, Zusammensetzungen, Jahreszahlen, Datumsangaben, Uhrzeiten, Geldbetraege, Dezimalbrueche, Dezimalzahlen