Detecção Automática de Sotaques Regionais Brasileiros: A Importância da Validação Cross-datasets
Nathália Alves Rocha Batista, Lee Luan Ling, Tiago Fernandes Tavares, Plínio Almeida Barbosa
DOI: 10.14209/sbrt.2018.335
Evento: XXXVI Simpósio Brasileiro de Telecomunicações e Processamento de Sinais (SBrT2018)
Keywords: Identificação de sotaques Reconhecimento de fala Sotaques Regionais Brasileiros Forense
Abstract
Neste artigo apresentamos uma análise sobre validação de sistemas de reconhecimento de sotaques regionais em português. Sistemas de identificação automática de sotaques tem sido, usualmente, avaliados usando uma metodologia de validação cruzada em dobras de uma base de dados. Esse procedimento parte da hipótese de que os resultados da validação cruzada generalizam para outras situações. Neste trabalho, usamos duas bases de dados gravadas independentemente para a realização de testes em um cenário cross-dataset. Os resultados nesse cenário, em termos de taxa de erros, são substancialmente inferiores aos encontrados na validação cruzada. Isso indica que testes em cenários cross-dataset são necessários para a validação adequada de sistemas de reconhecimento de sotaque.Download