Efeitos da Codificação MP3 em Sistemas de Reconhecimento Automático de Locutor via GMM
Frederico DAlmeida, Francisco Nascimento, Pedro de Azevedo Berger, Lúcio Martins da Silva
DOI: 10.14209/sbrt.2007.31182
Evento: XXV Simpósio Brasileiro de Telecomunicações (SBrT2007)
Keywords: Reconhecimento automático de locutor mistura de modelos de gaussianas codificação MP3
Abstract
Os sistemas de Reconhecimento Automático de Locutor (RAL) são de grande importância em aplicações forenses e de investigação. Nessas aplicações, um dos desafios é a variabilidade do formato de gravação do áudio que alimenta o sistema RAL. Este artigo apresenta um estudo abrangente sobre os efeitos da codificação MP3 no desempenho de sistemas de RAL utilizando modelos de mistura de gaussianas (Gaussian Mixture Models – GMM). São apresentados resultados de diversas simulações, com várias taxas de codificação (kb/s) e para várias freqüências de amostragem, demonstrando que, mesmo com taxas de codificação reduzidas e baixas freqüências de amostragem, é possível obter índices de acerto próximos a 100%, em grupo de 30 locutores.Download