1512 articles – 1650 references  [version française]
HAL: hal-00700406, version 1

Detailed view  Export this paper
14ème édition des Rencontres des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (JEP-TALN-RECITAL'2012), Grenoble : France (2012)
Mapping de l'espace spectral vers l'espace visuel de la parole: Les voyelles du Français en Langue Française Parlée Complétée
Zuheng Ming 1, Gang Feng 2, Denis Beautemps 2
(2012-06)

Cet article présente les résultats de l'approche statistique GMM pour le mapping des paramètres spectraux du signal acoustique de la parole vers les paramètres visuels de la Langue Parlée Complétée (LPC) au sens des moindres carrés, à un bas niveau d'interfaçage ce qui est innovant par rapport à l'approche classique texte-parole visuelle. A toute fin d'évaluation de l'approche GMM, nous présentons aussi les résultats de l'approche de modélisation multi-linéaire. Les résultats montrent que la méthode GMM améliore très significativement le mapping, tout particulièrement dans le cas de faible niveau de corrélation entre certains paramètres cibles comme ceux du LPC et les prédicteurs constitués des paramètres spectraux du signal acoustique de parole.
1:  Service d'ORL et de chirurgie cervicale
CHU Grenoble
2:  Grenoble Images Parole Signal Automatique (GIPSA-lab)
CNRS : UMR5216 – Université Joseph Fourier - Grenoble I – Université Pierre-Mendès-France - Grenoble II – Université Stendhal - Grenoble III – Institut Polytechnique de Grenoble - Grenoble Institute of Technology
MAGIC
Humanities and Social Sciences/Library and information sciences
LPC – LSP – MFCC – PARAMETRES LABIAUX – CONVERSION – MODELE LINEAIRE – GMMS
Attached file list to this document: 
PDF
Ming_Jep2012_Revised_v2.pdf(691.8 KB)