A computational model of perceptuo-motor processing in speech perception: learning to imitate and categorize synthetic CV syllables

Raphaël Laurent 1, 2, 3, * Jean-Luc Schwartz 2 Pierre Bessière 1, 4, * Julien Diard 3
* Auteur correspondant
1 E-MOTION - Geometry and Probability for Motion and Action
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
2 GIPSA-PCMD - PCMD
GIPSA-DPC - Département Parole et Cognition
Abstract : This paper presents COSMO, a Bayesian computational model, which is expressive enough to carry out syllable production, perception and imitation tasks using motor, auditory or perceptuo-motor information. An imitation algorithm enables to learn the articulatory-to-acoustic mapping and the link between syllables and correspond- ing articulatory gestures, from acoustic inputs only: syn- thetic CV syllables generated with a human vocal tract model. We compare purely auditory, purely motor and perceptuo-motor syllable categorization under various noise levels.
Type de document :
Communication dans un congrès
14th Annual Conference of the International Speech Communication Association (Interspeech 2013), Aug 2013, Lyon, France. Proceedings of Interspeech, pp.2797-2801, 2013
Liste complète des métadonnées

Littérature citée [29 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00827885
Contributeur : Raphaël Laurent <>
Soumis le : mercredi 29 mai 2013 - 18:36:31
Dernière modification le : jeudi 7 février 2019 - 16:31:14
Document(s) archivé(s) le : mardi 4 avril 2017 - 13:12:24

Fichier

Laurent_COSMO_processing_sylla...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00827885, version 1

Citation

Raphaël Laurent, Jean-Luc Schwartz, Pierre Bessière, Julien Diard. A computational model of perceptuo-motor processing in speech perception: learning to imitate and categorize synthetic CV syllables. 14th Annual Conference of the International Speech Communication Association (Interspeech 2013), Aug 2013, Lyon, France. Proceedings of Interspeech, pp.2797-2801, 2013. 〈hal-00827885〉

Partager

Métriques

Consultations de la notice

1107

Téléchargements de fichiers

192