Classificador de Qualidade de Voz em Sistemas de Comunicações baseado em Deep Learning
Lucas Hilário da Costa, Andreza P Batista, Renata Lopes Rosa, Demostenes Zegarra Rodriguez

DOI: 10.14209/sbrt.2022.1570817476
Evento: XL Simpósio Brasileiro de Telecomunicações e Processamento de Sinais (SBrT2022)
Keywords: qualidade de voz Deep Learning P.862 MOS
Abstract
Neste trabalho, dois modelos de deep learning (DL) são implementados para classificar a qualidade do sinal de voz transmitido em uma comunicação VoIP afetada pela perda de pacotes. O primeiro modelo estima a taxa de perda de pacotes (PLR) de sinais degradados e o segundo modelo estima a qualidade dos sinais de voz, classificando-os em quatro classes. Assim, foram elaborados dois bancos de dados, cada um contendo quatro classes distintas, utilizando arquivos de recomendação ITU-T P.501 de acordo com o índice Mean Opinion Score (MOS) de cada arquivo degradado. Observou-se que o modelo que estima o PLR teve 96% de acurácia, enquanto o modelo que estima o índice MOS atingiu 97% de acurácia. É importante destacar que o algoritmo ITU-T P.563 atingiu uma acurácia de 61,83%, a qual é inferior ao alcançado pelo modelo de estimação de MOS proposto, sendo que ambos modelos são não intrusivos.

Download