Skip to Main content Skip to Navigation
Conference papers

Réseau de neurones convolutif pour l'évaluation automatique de la prononciation

Résumé : Dans cet article, nous comparons deux approches d’évaluation automatique de la prononciation de locuteurs japonophones apprenant le français. La première, l’algorithme standard appelé Goodness Of Pronunciation (GOP), compare les vraisemblances obtenues lors d’un alignement forcé et lors d’une reconnaissance de phones sans contrainte. La deuxième, nécessitant également un alignement préalable, fait appel à un réseau de neurones convolutif (CNN) comme classifieur binaire, avec comme entrée des trames de coefficients spectraux. Les deux approches sont évaluées sur deux phonèmes cibles /R/ et /v/ du français, particulièrement difficiles à prononcer pour des Japonophones. Les paramètres du GOP (seuils) et du CNN sont estimés sur un corpus de parole lue par des locuteurs natifs du français, dans lequel des erreurs de prononciation artificielles sont introduites. Un gain de performance relatif de 13,4% a été obtenu avec le CNN, avec une précision globale de 72,6%, sur un corpus d’évaluation enregistré par 23 locuteurs japonophones.
Complete list of metadata

Cited literature [12 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01474878
Contributor : Open Archive Toulouse Archive Ouverte (oatao) <>
Submitted on : Thursday, February 23, 2017 - 11:40:13 AM
Last modification on : Thursday, March 18, 2021 - 2:16:00 PM
Long-term archiving on: : Wednesday, May 24, 2017 - 1:31:36 PM

File

pellegrini_17163.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01474878, version 1
  • OATAO : 17163

Citation

Thomas Pellegrini, Lionel Fontan, Halima Sahraoui. Réseau de neurones convolutif pour l'évaluation automatique de la prononciation. Journées d'Etudes sur la Parole (JEP 2016), Jul 2016, Paris, France. pp.624-632. ⟨hal-01474878⟩

Share

Metrics

Record views

603

Files downloads

1836