
Otimização de medidas MFCC em cenas acústicas para classificação de patologias laríngeas
Vinícius Jefferson Dias Vieira, Rafael R. Pertum, Renato Candido
DOI: 10.14209/sbrt.2025.1571157212
Evento: XLIII Simpósio Brasileiro de Telecomunicações e Processamento de Sinais (SBrT2025)
Keywords: Processamento de sinais de voz Classificação de patologias laríngeas MFCC Otimização
Abstract
Neste trabalho, é realizado um ajuste fino da medida acústica MFCC (Mel-Frequency Cepstral Coefficients) em diferentes cenários no contexto da classificação de patologias laríngeas. As cenas acústicas consideradas são: ambiente com e sem a presença de reverberação e ruído (com efeitos isolados e misturados) e a classificação individualizada por gênero. As patologias consideradas são: edema de Reinke, carcinoma, leucoplasia, laringite, pólipos e paralisia nas pregas vocais. O classificador empregado é baseado em análise discriminante quadrática. Os resultados indicam que há uma configuração ótima dessa medida, que proporciona os maiores valores de acurácia nos experimentos realizados. Ainda, é observado que a utilização de classificadores dedicados por gênero proporciona um ganho de acurácia relevante em relação ao resultado obtido com o classificador generalista.Download