A Multilinear Tongue Model Derived from Speech Related MRI Data of the Human Vocal Tract - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2016

A Multilinear Tongue Model Derived from Speech Related MRI Data of the Human Vocal Tract

Résumé

We present a multilinear statistical model of the human tongue that captures anatomical and tongue pose related shape variations separately. The model was derived from 3D magnetic resonance imaging data of 11 speakers sustaining speech related vocal tract configurations. The extraction was performed by using a minimally supervised method that uses as basis an image segmentation approach and a template fitting technique. Furthermore, it uses image denoising to deal with possibly corrupt data, palate surface information reconstruction to handle palatal tongue contacts, and a bootstrap strategy to refine the obtained shapes. Our experiments concluded that limiting the degrees of freedom for the anatomical and speech related variations to 5 and 4 respectively produces a model that can reliably register unknown data while avoiding overfitting effects.
Fichier principal
Vignette du fichier
article.pdf (9.34 Mo) Télécharger le fichier
compactness_phoneme.pdf (4.79 Ko) Télécharger le fichier
compactness_speaker.pdf (4.7 Ko) Télécharger le fichier
fixed_phone_specificity.pdf (23.24 Ko) Télécharger le fichier
generalization_phoneme.pdf (5.12 Ko) Télécharger le fichier
generalization_speaker.pdf (5 Ko) Télécharger le fichier
specificity_combined_phoneme.pdf (5.15 Ko) Télécharger le fichier
specificity_combined_speaker.pdf (5.07 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01418460 , version 1 (16-12-2016)
hal-01418460 , version 2 (14-04-2018)

Identifiants

Citer

Alexander Hewer, Stefanie Wuhrer, Ingmar Steiner, Korin Richmond. A Multilinear Tongue Model Derived from Speech Related MRI Data of the Human Vocal Tract. 2016. ⟨hal-01418460v1⟩
411 Consultations
460 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More