Reconhecimento de Emoções em Sinais de Fala Usando Transferência de Aprendizado
Sergio Gomes Junior, Flávio Ávila, Michel Pompeu Tcheou

DOI: 10.14209/sbrt.2019.1570558970
Evento: XXXVII Simpósio Brasileiro de Telecomunicações e Processamento de Sinais (SBrT2019)
Keywords:
Abstract
Neste artigo, propõe-se um sistema de reconhecimento de emoções em sinais de fala usando redes profundas convolucionais com as técnicas de transferência de aprendizado e aumento de base de dados. A transferência de aprendizado foi realizada a partir de uma rede residual (Resnet) de 34 camadas treinada para a base ImageNet. O aumento da base foi realizada alterando-se o pitch e alargando-se no tempo as amostras de sinais de fala das classes de felicidade, tristeza, raiva e neutra da base IEMOCAP (Interactive Emotional Dyadic Motion Capture). O sistema proposto foi capaz de classificar corretamente 81,26% das amostras.

Download