56: Optimale Bausteinauswahl in der korpusbasierten Sprachsynthese

Von Hamurabi Gamboa Rosales

Studientexte zur Sprachkommunikation, 56

 

TUDpress 2010. Kartoniert, 24,0 x 17,0 cm, XII, 132 S., zahlr. Abb.

 

Mit der Weiterentwicklung von korpusbasierter Sprachsynthese hin zu hochqualitativen Text-to-Speech-Systemen spielt die optimale Bausteinauswahl eine wichtige Rolle, um die Defizite zu überwinden, die sonst durch die Einschränkungen der konkatenativen Sprachsynthese mit einer kleinen Datenbasis entstehen. Korpusbasierte Sprachsynthese basiert auf einem Bausteinauswahlverfahren und einer großen Datenbasis, aus der die längstmöglichen Sprachbausteine ausgewählt werden. Lange Bausteineinheiten sorgen dafür, dass die wahrnehmbaren Unterschiede zwischen natürlicher Sprache und den synthetisierten Äußerungen so gering wie möglich sind und damit als weniger störend empfunden werden. Die Dissertation »Optimale Bausteinauswahl in der korpusbasierten Sprachsynthese« schlägt ein Bausteinauswahlverfahren für die korpusbasierte Sprachsynthese vor. Das Verfahren besteht aus einer linguistisch-phonetischen Umsetzung, dem Konzept der Anwendung einer großen Datenbasis und einer optimierten Bausteinauswahl. Die linguistisch-phonetische Umsetzung beinhaltet eine Graphem-zu-Phonem-Umsetzung für Englisch und Deutsch sowie eine Prosodiemodellierung, die durch die Verwendung von Klassifikations- und Regressionsbäumen implementiert werden. Die Graphem-zu-Phonem-Umsetzung liefert die notwendigen Informationen, um die Verständlichkeit der synthetisierten Äußerung zu garantieren. Die Prosodiemodellierung ermöglicht eine adäquate emotionale Expressivität. Das Ziel der Anwendung einer großen Datenbasis wird durch die Verwendung der Datenbasis erreicht, die während des EU-Projektes »Technology and Corpora for Speech to Speech Translation (TC-STAR)« entwickelt wurde.

Diesen Titel haben wir am Montag, 01. November 2010 in unseren Katalog aufgenommen.

 

ISBN: 978-3-941298-91-0

30,00 €

  • vergriffen