Compressão de Bancos de Fala para Sistemas de Síntese Concatenativa de Alta Qualidade
Augusto Henrique Hentz, Rui Seara
DOI: 10.14209/sbrt.2009.57721
Evento: XXVII Simpósio Brasileiro de Telecomunicações (SBrT2009)
Keywords: Codec iLBC compressão de sinais de fala conversão texto-fala LSFs
Abstract
Neste artigo, são apresentadas técnicas para reduzir a ocupação de memória de sistemas de conversão texto-fala concatenativos sem comprometer significativamente a qualidade da fala sintética. Para comprimir o banco de gravações mantendo a capacidade de decodificação parcial de segmentos, o que é fundamental para a aplicação em síntese concatenativa, propõese o uso do codec iLBC, que codifica quadros do sinal de fala de forma independente. O custo de concatenação no processo de seleção de unidades é calculado usando parâmetros LSF quantizados vetorialmente. A aplicação da abordagem proposta em um sistema de conversão texto-fala para o português brasileiro proporciona uma redução de até 76% na ocupação de memória. Avaliações perceptuais indicam que a quantização vetorial dos parâmetros para cálculo do custo de concatenação não causa perda significativa na qualidade da fala sintética.Download