Efeitos da Segmentação das Locuções de Treinamento em Modelos Híbridos ANN+HMM

José Antonio Moreira de Rezende; Carlos Ynoguti

doi:10.14209/sbrt.2005.550

Efeitos da Segmentação das Locuções de Treinamento em Modelos Híbridos ANN+HMM

José Antonio Moreira de Rezende, Carlos Ynoguti

DOI: 10.14209/sbrt.2005.550

Evento: XXII Simpósio Brasileiro de Telecomunicações (SBrT2005)

Keywords: Modelos hı́bridos ANN+HMM reconhecimento de fala contı́nua segmentação automática de fala

Abstract

Este artigo apresenta uma investigação feita em torno da variação do desempenho de um sistema de reconhecimento de fala contı́nua baseado em modelos hı́bridos ANN+HMM, quando s ão deslocadas as marcas da segmentação fonética das locuções de treinamento. Com estes resultados seria possı́vel determinar o erro máximo que um segmentador automático poderia cometer sem deteriorar de forma significativa o desempenho do sistema. Observou-se que erros de até aproximadamente 30ms nas marcas de segmentação não produziram aumentos notáveis na taxa de erros de palavra; valores de erro maiores do que este limiar produziram uma queda bastante acentuada no desempenho. Os testes foram conduzidos em um sistema de reconhecimento de fala contı́nua, dependente de locutor, operando sobre um vocabulário de aproximadamente 200 palavras.

Download