Détection des erreurs de phonétisation pour la synthèse de parole - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Détection des erreurs de phonétisation pour la synthèse de parole

Résumé

En synthèse de parole par corpus, la création d'une voix passe par la transcription d'enregistrements de parole lue en séquences phonétiques. Celle-ci est produite par une phonétisation automatique du texte lu, suivie d'une validation manuelle de la transcription. Cette étape de correction est potentiellement longue alors que peu d'erreurs de phonétisation sont présentes. Nous proposons une méthode de détection des erreurs de phonétisation fondée sur l'utilisation du signal de parole. Cette méthode met en oeuvre un modèle acoustique issu de la reconnaissance de la parole pour aligner un lexique phonétisé sur le signal transcrit en mots. Nous montrons que nous détectons de 50.98% à 79.99% des erreurs de phonétisation selon le lexique utilisé, pour un phonétiseur évalué à 1.8% de taux d'erreur. De plus, les phonèmes annotés comme erronés représentent entre 2.9% et 3.6% du corpus, ce qui permet de réduire de façon importante la quantité de données à valider manuellement.
Fichier principal
Vignette du fichier
vythelingum_lium_papier.pdf (87.73 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01762424 , version 1 (10-04-2018)

Identifiants

  • HAL Id : hal-01762424 , version 1

Citer

Kévin Vythelingum. Détection des erreurs de phonétisation pour la synthèse de parole. 17e Journée des Doctorants de l'ED STIM, May 2017, Nantes, France. ⟨hal-01762424⟩
96 Consultations
157 Téléchargements

Partager

Gmail Facebook X LinkedIn More