Détection des erreurs de phonétisation pour la synthèse de parole

Résumé : En synthèse de parole par corpus, la création d'une voix passe par la transcription d'enregistrements de parole lue en séquences phonétiques. Celle-ci est produite par une phonétisation automatique du texte lu, suivie d'une validation manuelle de la transcription. Cette étape de correction est potentiellement longue alors que peu d'erreurs de phonétisation sont présentes. Nous proposons une méthode de détection des erreurs de phonétisation fondée sur l'utilisation du signal de parole. Cette méthode met en oeuvre un modèle acoustique issu de la reconnaissance de la parole pour aligner un lexique phonétisé sur le signal transcrit en mots. Nous montrons que nous détectons de 50.98% à 79.99% des erreurs de phonétisation selon le lexique utilisé, pour un phonétiseur évalué à 1.8% de taux d'erreur. De plus, les phonèmes annotés comme erronés représentent entre 2.9% et 3.6% du corpus, ce qui permet de réduire de façon importante la quantité de données à valider manuellement.
Document type :
Conference papers
Complete list of metadatas

Cited literature [5 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01762424
Contributor : Kévin Vythelingum <>
Submitted on : Tuesday, April 10, 2018 - 9:51:10 AM
Last modification on : Friday, April 26, 2019 - 1:35:36 PM

File

vythelingum_lium_papier.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01762424, version 1

Collections

Citation

Kévin Vythelingum. Détection des erreurs de phonétisation pour la synthèse de parole. 17e Journée des Doctorants de l'ED STIM, May 2017, Nantes, France. ⟨hal-01762424⟩

Share

Metrics

Record views

61

Files downloads

65