Um Conjunto de 1000 Frases Foneticamente Balanceadas para o Português Brasileiro Obtido Utilizando a Abordagem de Algoritmos Genéticos
Ricardo Cirigliano, Clarisse Monteiro, Filipe Barbosa, Fernando Resende, Letícia Couto, João Moraes

DOI: 10.14209/sbrt.2005.544
Evento: XXII Simpósio Brasileiro de Telecomunicações (SBrT2005)
Keywords: Base de dados foneticamente balanceado síntese de voz português brasileiro
Abstract
Este trabalho apresenta um algoritmo que é utilizado na obtenção de um conjunto de 1000 frases foneticamente balanceadas, com diversas aplicações em processamento de voz. Os conjuntos utilizados até então, além de serem consideravelmente menores, foram projetados para uma variedade específica da língua portuguesa. Neste trabalho, o conjunto de 1000 frases é obtido utilizando-se técnicas de algoritmo genético, visando a minimizar o número de unidades de síntese de voz não vistas na base. O espaço de busca de tal conjunto é um corpus eletrônico de um jornal brasileiro. Resultados mostram que o conjunto obtido é foneticamente balanceado para os fones representativos da variedade do português falado nos telejornais de abrangência nacional.

Download