Novos Recursos e Utilização de Adaptação de Locutor no Desenvolvimento de um Sistema de Reconhecimento de Voz para o Português Brasileiro
Patrick Silva, Nelson Neto, Aldebaro Klautau
DOI: 10.14209/sbrt.2009.58065
Evento: XXVII Simpósio Brasileiro de Telecomunicações (SBrT2009)
Keywords: Corpus reconhecimento de voz sistemas em tempo-real
Abstract
Este trabalho descreve o estágio atual do desenvolvimento de um sistema de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. Os novos recursos produzidos consistem de corpora de voz digitalizada e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho apresenta resultados experimentais usando-se tais recursos. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de ploblemas de descasamento acústico entre corpora de voz. Para construção dos modelos acústicos e de linguagem, fez-se uso das ferramentas HTK e SRILM, respectivamente. Todos os recursos desenvolvidos estão disponíveis no site do projeto FalaBrasil.Download