Avaliação da soprosidade vocal em amostras codificadas pelo codec IETF Opus
João Pedro Hallack Sansão, Leonardo Carneiro de Araújo, Hani Camille Yehia, Maurílio Nunes Vieira

DOI: 10.14209/sbrt.2015.76
Evento: XXXIII Simpósio Brasileiro de Telecomunicações (SBrT2015)
Keywords:
Abstract
O comportamento de correlatos acústicos à soprosidade vocal foi investigado em diferentes níveis de compressão. O codec utilizado foi o IETF Opus com bitrates entre 16 e 256 kbps. As medidas escolhidas foram: Smoothed cepstral peak prominence (CPPS), spectral flatness of the residue signal (SFRS), pitch amplitude (PA) e spectrographic signal-to-noise-ratio (S2NR). A investigação foi conduzida em duas etapas: inicialmente usando amostras de voz sintética que tinham como referência a relação sinal-ruído controlada e posteriormente amostras de voz natural classificadas perceptivamente em soprosidade. As medidas acústicas mantiveram alta correlação com as respectivas referências: SNR para voz sintética e soprosidade para voz natural. O erro quadrático médio estabilizou-se na maior parte das medidas até a taxa de 128 kbps. Considerando os resultados, o Opus não comprometeu a avaliação da soprosidade e sua adoção irá permitir economia em armazenamento e largura de banda na transmissão das amostras.

Download