Rede Convolucional Deformável Aplicada a Sistemas de KWS Robusto ao Ruído
Ênio Silva, Rui Seara

DOI: 10.14209/sbrt.2023.1570915295
Evento: XLI Simpósio Brasileiro de Telecomunicações e Processamento de Sinais (SBrT2023)
Keywords: Convolução deformável Detecção de palavras-chave Reconhecimento automático de fala Robustez ao ruído
Abstract
Este trabalho apresenta uma discussão sobre o uso de convolução deformável em sistemas de detecção de palavras-chave (keyword spotting - KWS) para operação em ambientes de baixa razão sinal-ruído (signal-to-noise ratio - SNR). A robustez ao ruído ainda é um problema crítico em aplicações de reconhecimento automático de fala do mundo real. Para mitigar esse problema, visando a obtenção de características discriminativas que descrevam melhor as pistas acústicas em cenários com baixa SNR, o uso de redes neurais convolucionais deformáveis (DefCNN) é considerado no processo de extração de características do sinal de fala. Resultados de simulação numérica são apresentados visando avaliar a acurácia do reconhecimento de palavras-chave, confirmando a eficácia do uso de DefCNN em aplicações de KWS.

Download