Sintesi Vocale Concatenativa per l’italiano Tramite Modello Sinusoidale

Viene descritta una applicazione per la sintesi vocale dell'italiano. È progettata per implementare la parte di elaborazione del segnale di un sistema TTS, ovvero quella che si occupa di creare un file audio (.wav) a partire da un file fonetico (.pho) relativo alla frase da pronunciare.
A tale scopo viene utilizzato un database di difoni pre-registrati, dalla cui concatenazione si ottiene l'output audio. Le operazioni sui difoni vengono effettuate secondo tecniche sinusoidali (più precisamente tecniche SMS, Spectral Modeling Synthesis).
Il database di difoni è quello usato da MBROLA, applicazione di sintesi vocale nel dominio temporale. Tale programma è stato usato in alcuni test di confronto.
È stato utilizzato lo Spectral Modeling Synthesis (SMS) come modello spettrale per l'elaborazioni del segnale, ed in particolare il framework CLAM per l'implementazione software.

Tipo Pubblicazione: 
Contributo in atti di convegno
Author or Creator: 
Giacomo Sommavilla
Carlo Drioli
Piero Cosi
Publisher: 
EDK Editore, Torriana, ITA
Source: 
AISV 2005 - 2° Convegno Nazionale AISV - "Analisi prosodica - teorie, modelli e sistemi di annotazione", pp. 113 (CD Rom 761)–113 (CD Rom 772), Fisciano, Salerno, Italy, Novembre 30 - December 2, 2005
Date: 
2006
Resource Identifier: 
http://www.cnr.it/prodotto/i/139811
http://www.aisv.it/AISV2005/default.htm
urn:isbn:88-95112-21-0
Language: 
Ita
Eng