Acquisition temps-réel de données articulatoires par IRM : application à la synthèse par copie

Benjamin Elie 1 Yves Laprie 1 Pierre-André Vuissoz 2
1 MULTISPEECH - Speech Modeling for Facilitating Oral-Based Communication
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : L'étude de la production de la parole nécessite de connaitre précisément l'évolution temporelle de la géométrie du conduit vocal. Récemment, l'imagerie par résonance magnétique (IRM) a été couramment utilisée car elle possède les avantages d'offrir une image des tissus internes avec un fort contraste, de sélectionner des coupes précises , tout en étant inoffensive pour les sujets. Toutefois, les contraintes sur le temps d'acquisition peuvent être un obstacle majeur pour l'acquisition en temps-réel des mouvements articulatoires rapides du fait d'une cadence d'acquisition trop faible. Cette étude présente une méthode permettant d' accélérer la cadence d'acquisition, jusqu'à obtenir 36 images par seconde, grâce à l'acquisition compressée (ou Compressed Sensing). En effet, en utilisant l'a priori d'une forte parcimonie de la transformée de Fourier temporelle de la séquence d'image, et en choisissant un par-cours adapté dans l'espace d'acquisition, il est alors possible de réduire considérablement le nombre d'observations dans l'espace d'acquisition, tout en garantissant une reconstruction satisfaisante de la séquence d'image pour leur post-traitement. Celui-ci est effectué a l'aide d'une reconnaissance des contours des différents articulateurs, ainsi que de l'utilisation d'un mod ele articulatoire adapté, ce qui permet alors d'extraire l'´ évolution temporelle des paramètres du modèle articulatoire, ainsi que les fonctions d'aire correspondantes. Nous montrons également que ces données peuvent alors servir de paramètres d' entrée de synthétiseurs acoustiques dans le but d'analyser le lien entre les mouvements articulatoires du locuteur et les indices acoustiques de la parole.
Type de document :
Communication dans un congrès
13ème Congrès Français d'Acoustique (CFA 2016), Apr 2016, Le Mans, France. 2016, 〈http://cfa2016.univ-lemans.fr/fr/index.html〉
Liste complète des métadonnées

Littérature citée [22 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01314313
Contributeur : Benjamin Elie <>
Soumis le : mardi 21 juin 2016 - 17:03:10
Dernière modification le : mardi 18 décembre 2018 - 16:38:02

Fichier

000266.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01314313, version 2

Citation

Benjamin Elie, Yves Laprie, Pierre-André Vuissoz. Acquisition temps-réel de données articulatoires par IRM : application à la synthèse par copie. 13ème Congrès Français d'Acoustique (CFA 2016), Apr 2016, Le Mans, France. 2016, 〈http://cfa2016.univ-lemans.fr/fr/index.html〉. 〈hal-01314313v2〉

Partager

Métriques

Consultations de la notice

264

Téléchargements de fichiers

138