Détection des erreurs de phonétisation pour la synthèse de parole

Kévin Vythelingum

Communication Dans Un Congrès Année : 2017

Détection des erreurs de phonétisation pour la synthèse de parole

(1, 2, 3)

1
2
3

Kévin Vythelingum

Fonction : Auteur
PersonId : 18783
IdHAL : kevin-vythelingum
ORCID : 0000-0001-9705-8943

Equipe Language and Speech Technology

Laboratoire d'Informatique de l'Université du Mans

Voxygen [Pleumeur-Bodou]

Résumé

En synthèse de parole par corpus, la création d'une voix passe par la transcription d'enregistrements de parole lue en séquences phonétiques. Celle-ci est produite par une phonétisation automatique du texte lu, suivie d'une validation manuelle de la transcription. Cette étape de correction est potentiellement longue alors que peu d'erreurs de phonétisation sont présentes. Nous proposons une méthode de détection des erreurs de phonétisation fondée sur l'utilisation du signal de parole. Cette méthode met en oeuvre un modèle acoustique issu de la reconnaissance de la parole pour aligner un lexique phonétisé sur le signal transcrit en mots. Nous montrons que nous détectons de 50.98% à 79.99% des erreurs de phonétisation selon le lexique utilisé, pour un phonétiseur évalué à 1.8% de taux d'erreur. De plus, les phonèmes annotés comme erronés représentent entre 2.9% et 3.6% du corpus, ce qui permet de réduire de façon importante la quantité de données à valider manuellement.

Mots clés

Phonétisation Synthèse de parole Reconnaissance de la parole Alignement forcé

Domaines

Informatique et langage [cs.CL]

Fichier principal

vythelingum_lium_papier.pdf (87.73 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Kévin Vythelingum : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01762424

Soumis le : mardi 10 avril 2018-09:51:10

Dernière modification le : mardi 3 mars 2020-16:22:36

Dates et versions

hal-01762424 , version 1 (10-04-2018)

Identifiants

HAL Id : hal-01762424 , version 1

Citer

Kévin Vythelingum. Détection des erreurs de phonétisation pour la synthèse de parole. 17e Journée des Doctorants de l'ED STIM, May 2017, Nantes, France. ⟨hal-01762424⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-LEMANS LIUM LIUM-LST

96 Consultations

157 Téléchargements

Détection des erreurs de phonétisation pour la synthèse de parole

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager