05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Permanent URI for this collectionhttps://elib.uni-stuttgart.de/handle/11682/6

Browse

Search Results

Now showing 1 - 2 of 2
  • Thumbnail Image
    ItemOpen Access
    Textvorverarbeitung zur deutschen Version des Festival Text-to-Speech Synthese Systems
    (1997) Breitenbücher, Mark
    Im Rahmen einer Studienarbeit sollte eine Textvorverarbeitungskomponente fuer das Multilinguale Sprachsynthesesystem FESTIVAL entwickelt werden. Unter anderem wurden Verfahren zur Erkennung und Expansion verschiedener Zahlenformate, Abkuerzungenund Sonderzeichen implementiert. Des weiteren wurden Ueberlegungen zur Anbindung einer morphosyntaktischen Komponente angestellt, die in einer weiteren Studien- oder Diplomarbeit vollzogen werden soll. Inhalt: Einfuehrung, Was ist Text-to-Speech Synthese?, Wozu Text-to-Speech Synthese?, Aufbau eines TTS-Systems, Die Textvorverarbeitung, linguistische Verarbeitung, Synthese, Das Festival Speech Synthese System, Die Benutzung von Festival, Die Aeusserungen in Festival, Die Module in Festival, Initialisierung, Tokenisierung, Token POS, Token-to-Word Regeln, POS Tagging, Phrasierung, Lexikon-Lookup, Intonation 1, Dauer, Intonation 2, Synthese, Die Werkzeuge von Festival, Erweiterung der CART trees, Erweiterung des Festival-Regex-Tools, Festival-Regex: string-matches, Die Erweiterung: pattern-matches, Die deutsche Textvorverarbeitung in Festival, Aufsplittung von Zusammensetzungen, Expansion von Zahlen, Brueche, Verhaeltniszahlen, Telefonnummern, Zusammensetzungen, Jahreszahlen, Datumsangaben, Uhrzeiten, Geldbetraege, Dezimalbrueche, Dezimalzahlen
  • Thumbnail Image
    ItemOpen Access
    Untersuchung der Sprecherindividualität höherer Formanten
    (2004) Kremer, Gerhard
    Die Behauptung, höhere Formanten seien sprecherspezifisch, scheint angemessen zu sein. Dennoch konnte ich keine Studien dazu finden, die dies belegen. In der vorliegenden Arbeit untersuchte ich die Individualität der Formanten F4-F7 der 16 Sprecher aus dem deutschen "Kiel-Korpus der spontanen gesprochenen Sprache". Auf der Grundlage einer LPC-Analyse ließ ich daraus mit Hilfe von Programmwerkzeugen von Entropic die Formantfrequenzdaten aller Sprachsignaldateien erzeugen. Mit einem Perl-Skript extrahierte ich die Daten der Vokale [a], [i], [u] und der Nasale [m], [n] und [\ng]. Ich wertete die Daten mit den statistischen Verfahren T-Test und ANOVA aus, wofür ich das Statistik-Programm R benutzte. Die Verteilungen der Formantfrequenzdaten unterschieden sich hochsignifikant bei allen sieben Formanten in Abhängigkeit der Faktoren Sprecher, Sprachlaut und der Sprecher-Sprachlaut-Kombination.