Sintesi Vocale Concatenativa per litaliano Tramite Modello Sinusoidale

Viene descritta una applicazione per la sintesi vocale dell'italiano. È progettata per implementare la parte di elaborazione del segnale di un sistema TTS, ovvero quella che si occupa di creare un file audio (.wav) a partire da un file fonetico (.pho) relativo alla frase da pronunciare.
A tale scopo viene utilizzato un database di difoni pre-registrati, dalla cui concatenazione si ottiene l'output audio. Le operazioni sui difoni vengono effettuate secondo tecniche sinusoidali (più precisamente tecniche SMS, Spectral Modeling Synthesis).
Il database di difoni è quello usato da MBROLA, applicazione di sintesi vocale nel dominio temporale. Tale programma è stato usato in alcuni test di confronto.
È stato utilizzato lo Spectral Modeling Synthesis (SMS) come modello spettrale per l'elaborazioni del segnale, ed in particolare il framework CLAM per l'implementazione software.

Tipo Pubblicazione:

Contributo in atti di convegno

Author or Creator:

Giacomo Sommavilla

Carlo Drioli

Piero Cosi

Publisher:

EDK Editore, Torriana, ITA

Source:

AISV 2005 - 2° Convegno Nazionale AISV - "Analisi prosodica - teorie, modelli e sistemi di annotazione", pp. 113 (CD Rom 761)–113 (CD Rom 772), Fisciano, Salerno, Italy, Novembre 30 - December 2, 2005

Date:

2006

Resource Identifier:

http://www.cnr.it/prodotto/i/139811

http://www.aisv.it/AISV2005/default.htm

urn:isbn:88-95112-21-0

Language:

Ita

Eng

Sintesi Vocale Concatenativa per litaliano Tramite Modello Sinusoidale