Reconhecimento de Palavras Isoladas Utilizando Fluxo Óptico e Redes Neurais Artificiais através de Informações Visuais
Thiago Vinícius Dantas Ferraz, Dr. Gustavo Fernandes Rodrigues

DOI: 10.14209/sbrt.2015.77
Evento: XXXIII Simpósio Brasileiro de Telecomunicações (SBrT2015)
Keywords:
Abstract
Este trabalho tem como objetivo o desenvolvimento de um sistema de reconhecimento de fala através do rastreamento dos movimentos dos lábios a partir de um vídeo utilizando a análise de fluxo óptico para funcionar em ambientes ruidosos. A maioria dos sistemas de reconhecimento de fala não possui um bom desempenho em ambientes ruidosos. Para a tarefa de reconhecimento foi utilizado uma rede neural com arquitetura feedforward multicamadas com aprendizagem baseada no algo-ritmo de retropropagação do erro (backpropagation). Foi utilizado exclusivamente informações visuais obtidas através de um banco de dados composto de gravações de vídeos correspondentes aos dígitos de 0 a 9 pronunciados em português por um indivíduo do sexo masculino. A melhor taxa de acertos da rede usando apenas informação visual para o reconhecimento de fala foi de aproximadamente 79%.

Download