Mapping de l'espace spectral vers l'espace visuel de la parole: Les voyelles du Français en Langue Française Parlée Complétée

Zuheng Ming; Gang Feng; Denis Beautemps

Communication Dans Un Congrès Année : 2012

Mapping de l'espace spectral vers l'espace visuel de la parole: Les voyelles du Français en Langue Française Parlée Complétée

(1) , (2) , (2)

1
2

Zuheng Ming

Fonction : Auteur
PersonId : 735516
IdHAL : zuheng-ming
ORCID : 0000-0002-1094-3112

Service d'ORL et de chirurgie cervicale

Gang Feng

Fonction : Auteur
PersonId : 882696

GIPSA - Machines parlantes, Gestes oro-faciaux, Interaction Face-à-face, Communication augmentée

Denis Beautemps

Fonction : Auteur
PersonId : 18206
IdHAL : denis-beautemps
ORCID : 0000-0001-9625-3018
IdRef : 099427524

GIPSA - Machines parlantes, Gestes oro-faciaux, Interaction Face-à-face, Communication augmentée

Résumé

In this paper, we present a statistical method based on GMM modeling to map the acoustic speech spectral features to visual features of Cued Speech in the sense of least square error in a low signal level which is innovative and different with the classic text-to-visual approach. In comparison with the GMM based mapping modeling we first present the results with the use of a multi-linear model also at the low signal level and study the limitation of the approach. The experimental results demonstrate that the GMM based mapping method can significant improve the mapping performance compared with the multi-linear based mapping model especial in the sense of the weak linear correlation between the target and the predictor such as the hand positions of Cued Speech and the acoustic speech spectral features.

Cet article présente les résultats de l'approche statistique GMM pour le mapping des paramètres spectraux du signal acoustique de la parole vers les paramètres visuels de la Langue Parlée Complétée (LPC) au sens des moindres carrés, à un bas niveau d'interfaçage ce qui est innovant par rapport à l'approche classique texte-parole visuelle. A toute fin d'évaluation de l'approche GMM, nous présentons aussi les résultats de l'approche de modélisation multi-linéaire. Les résultats montrent que la méthode GMM améliore très significativement le mapping, tout particulièrement dans le cas de faible niveau de corrélation entre certains paramètres cibles comme ceux du LPC et les prédicteurs constitués des paramètres spectraux du signal acoustique de parole.

Mots clés

Cued Speech LSP MFCC Lips Linear modeling GMMs

LPC PARAMETRES LABIAUX CONVERSION MODELE LINEAIRE

Domaines

Sciences de l'information et de la communication

Fichier principal

Ming_Jep2012_Revised_v2.pdf (686.51 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Denis Beautemps : Connectez-vous pour contacter le contributeur

https://hal.science/hal-00700406

Soumis le : mardi 22 mai 2012-18:55:30

Dernière modification le : jeudi 4 avril 2024-21:15:22

Archivage à long terme le : jeudi 23 août 2012-02:41:16

Dates et versions

hal-00700406 , version 1 (22-05-2012)

Identifiants

HAL Id : hal-00700406 , version 1

Citer

Zuheng Ming, Gang Feng, Denis Beautemps. Mapping de l'espace spectral vers l'espace visuel de la parole: Les voyelles du Français en Langue Française Parlée Complétée. JEP-TALN-RECITAL 2012 - conférence conjointe 29e Journées d'Études sur la Parole, 19e Traitement Automatique des Langues Naturelles, 14e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2012, Grenoble, France. pp.73-80. ⟨hal-00700406⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS GIPSA GIPSA-DPC GIPSA-MAGIC

193 Consultations

352 Téléchargements

Mapping de l'espace spectral vers l'espace visuel de la parole: Les voyelles du Français en Langue Française Parlée Complétée

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager