Criação de modelos estocásticos para a síntese de vogais considerando os pulsos glotais de Rosenberg e de Liljencrants-Fant com parâmetros unificados
Diego S. M. Bahiano, Edson Cataldo

DOI: 10.14209/SBRT.2020.1570644350
Evento: XXXVIII Simpósio Brasileiro de Telecomunicações e Processamento de Sinais (SBrT2020)
Keywords:
Abstract
Na produção da voz, a variação dos comprimentos dos ciclos glotais em relação a um valor médio causada pelo movimento (quase) periódico das cordas vocais gera o fenômeno aleatório conhecido por jitter. Seu estudo é importante devido a aplicações como a identificação de patologias relacionadas à voz, melhoria da naturalidade da voz sintetizada e a calibração de algoritmos de processamento de sinais para identificação de ciclos glotais. O objetivo deste trabalho é propor modelos estocásticos para a produção da voz, com geração do jitter, considerando a variação instantânea do intervalo de tempo glotal como um processo estocástico. Sinais de vozes são sintetizados com baixos níveis de jitter, vozes normais, e com níveis de jitter mais altos, gerando vozes roucas.

Download