Supressão de Eco Acústico por Máscara Tempo-Frequência e Redes Neurais Recorrentes

Erik Santana Milesi; Bruno C. Bispo

doi:10.14209/sbrt.2024.1571032318

Supressão de Eco Acústico por Máscara Tempo-Frequência e Redes Neurais Recorrentes

Erik Santana Milesi, Bruno C. Bispo

DOI: 10.14209/sbrt.2024.1571032318

Evento: XLII Simpósio Brasileiro de Telecomunicações e Processamento de Sinais (SBrT2024)

Keywords: Eco acústico Supressão de eco Conversação cruzada Máscara tempo-frequência

Abstract

Este artigo avalia a combinação de redes neurais recorrentes (RNNs) e máscaras tempo-frequência na supressão de eco acústico. Quatro arquiteturas de RNNs são propostas para estimar a máscara de razão ideal, a qual é aplicada para suprimir o eco em situações de conversação cruzada. Os resultados indicam que, nos trechos de fala única, modelos causais e de baixo custo computacional conseguem atenuar o eco em 20, 34 e 49 dB para níveis de razão sinal-eco de 0, 3,5 e 5 dB, respectivamente, enquanto modelos não-causais e de alto custo computacional alcançam resultados pelo menos 15 dB superiores. No entanto, o melhor desempenho dos modelos de alto custo computacional não se reflete significativamente na qualidade e na inteligibilidade dos trechos de conversação cruzada.

Download