Skip to content

Sociedade Brasileira de Telecomunicações

Detecção de Atividade Vocal com o uso de Máquinas de Boltzmann Restritas Discriminativas


A detecção de atividade vocal (VAD – Voice Activity Detection) tem apreciável impacto no desempenho de aplicações tecnológicas atuais, tais como comunicações sem fio e reconhecimento de fala. Neste trabalho, aborda-se a tarefa de VAD por meio da aprendizagem de máquina usando-se uma estrutura denominada Máquina de Boltzmann Restrita Discriminativa (DRBM – Discriminative Restricted Boltzmann Machine). Com o emprego de vetores de características baseados tanto em coeficientes mel-cepstrais quanto em energias em bandas do espectro, chega-se a desempenhos levemente superiores aos do VAD denominado Long-Term Spectral Divergence (LTSD), usado frequentemente como base de comparação para outros detectores. Os resultados indicam ainda que a DRBM é capaz de lidar com vetores de características fortemente correlacionados.

Autores :

Estatatísticas de Acesso

Loading...

Total de visitas: 5
Loading...

Downloads do artigo: 0

Voltar