Detecção de Atividade Vocal com o uso de Máquinas de Boltzmann Restritas Discriminativas
Rogério G. Borin, Magno T. M. Silva
DOI: 10.14209/sbrt.2016.184
Evento: XXXIV Simpósio Brasileiro de Telecomunicações (SBrT2016)
Keywords: Máquina de Boltzmann Restrita Discriminativa Detecção de Atividade Vocal Coeficientes Mel-Cepstrais Aprendizagem de Máquina para Processamento de Sinais.
Abstract
A detecção de atividade vocal (VAD – Voice Activity Detection) tem apreciável impacto no desempenho de aplicações tecnológicas atuais, tais como comunicações sem fio e reconhecimento de fala. Neste trabalho, aborda-se a tarefa de VAD por meio da aprendizagem de máquina usando-se uma estrutura denominada Máquina de Boltzmann Restrita Discriminativa (DRBM – Discriminative Restricted Boltzmann Machine). Com o emprego de vetores de características baseados tanto em coeficientes mel-cepstrais quanto em energias em bandas do espectro, chega-se a desempenhos levemente superiores aos do VAD denominado Long-Term Spectral Divergence (LTSD), usado frequentemente como base de comparação para outros detectores. Os resultados indicam ainda que a DRBM é capaz de lidar com vetores de características fortemente correlacionados.Download