Modélisation du conduit vocal - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 2007

Modélisation du conduit vocal

Alain Ghio

Résumé

si possible de manière interprétable, de cette masse d'informations. Dans ce cas-là, ce sont les données observées qui sont considérées comme des données d'entrée, primordiales et incontestables. Les paramètres du modèle sont alors ajustés pour rendre compte au mieux de ces données, quitte à perdre une partie de la capacité d'interprétation du modèle. Les modèles les mieux aboutis sont ceux qui mêlent les deux approches : une bonne modélisation prédictive suppose au moins la prédiction de situations observées, c'est-à-dire une bonne description. Inversement, une bonne desLa modélisation acoustique du conduit vocal La modélisation acoustique de la parole consiste à produire une séquence de sons en fonction de paramètres acoustiques tels que l'amplitude de voisement, l'amplitude de friction, les valeurs des formants... Le synthétiseur de Klatt (1980) reste le système le plus représentatif et comporte une quarantaine de paramètres de contrôle dont les valeurs doivent être modifiées dans le temps à intervalles très courts lors de la production d’une séquence sonore dynamique. Le modèle général intègre un petit ensemble de principes formulés dans le domaine acoustique uniquement et permet une grande liberté sur le résultat sonore, autorisant même la génération de configurations phonétiques aberrantes s’éloignant d’une production réelle de parole. Il est bien évident que ces réserves n’enlèvent aucunement l’intérêt scientifique de tels dispositifs, notamment pour la génération de stimuli synthétiques de parole. La modélisation à tubes du conduit vocal En décrivant le conduit vocal comme 4 tubes de dimensions variables connectés entre eux, le modèle de Fant (1960) est capable de prédire et générer un résultat acoustique en accord avec la réalité. Cette modélisation à l’aide de tubes a été reprise dans de nombreux travaux ultérieurs. Les innovations ont consisté à augmenter le nombre de tubes et à tenir compte de plus en plus de phénomènes aérodynamiques comme la viscosité, les pertes aux parois… Par généralisation, est appelée fonction d’aire la représentation bidimensionnelle du conduit vocal considéré comme la concaténation de tubes et mettant en relation les caractéristiques géométriques de ces tubes en fonction de la distance par rapport à la glotte. A partir de telles données d’entrée, il est possible, par le biais d’équations mathématiques relatives à la propagation des sons et en opérant des simplifications, d’obtenir la fonction de transfert du tube, c'est-à-dire la fonction qui définit les propriétés de filtrage du conduit transformant un signal source (ex : vibration laryngée) en signal de sortie, c'est-à-dire en données sonores articulées. Dans ce type d’approche, l’obtention de données géométriques réelles du conduit est essentielle. Les observations ont porté sur des moulages du conduit vocal, des coupes sagittales par cinéradiographie X et des coupes "tridimensionnelles" obtenues par IRM. La modélisation de la position des organes articulatoires La modélisation articulatoire du conduit vocal consiste à utiliser des paramètres de position des articulateurs comme paramètres de contrôle du modèle et de générer en sortie de façon indirecte le signal de parole. Les modèles statistiques de l’articulation utilisent une approche montante, fondée sur un corpus de coupes sagittales dont l’analyse statistique permet d’extraire des caractéristiques articulatoires pertinentes et interprétables. Ainsi, l'approche de Maeda (1990) a permis de décomposer l'ensemble des configurations articulatoires observées en mouvements élémentaires des articulateurs: position de la mandibule (ouverte/fermée), position du corps de la langue (avant/arrière), forme du dos de la langue (voûtée/plate), position de l’apex (relevé/abaissé), aire aux lèvres, protrusion des lèvres, hauteur du larynx, aire glottique. Les modèles à structures solides utilisent une approche descendante, fondée sur la représentation solide de l’organe. Cette approche a le mérite de reproduire, au mieux, un fonctionnement anatomique. Le modèle du tractus vocal d’Haskins (Rubin et al., 1981) fournit une description cinématique des articulateurs de la parole à partir de la position dynamique de six structures principales : mâchoire, voile du palais, corps de la langue, apex de la langue, lèvres et os hyoïde. La position de chaque articulateur n’est pas totalement libre dans l’espace et suit un ensemble de contraintes géométriques « réalistes ». Les simplifications nécessaires à une telle modélisation peuvent entraîner un pouvoir de description appauvri, dans lequel le résultat acoustique produit s’éloigne des données observées. La modélisation physiologique des organes articulatoires La représentation tridimensionnelle des organes articulatoires et la détermination d'un certain nombre de propriétés et mouvements de base, permettent de modéliser simplement, mais avec une très bonne précision, les mouvements complexes des articulateurs tels que les lèvres, la mâchoire, la langue, le voile du palais... Chacun de ces organes a été modélisé de façon indépendante (Sanguinetti et al., 1998 ; Perrier et al., 2003) ou intégré dans un modèle complet (Badin et al., 2002). Dans le modèle de langue de Perrier et al. (2003), l'action des muscles est simulée par l'application d'une force exercée sur un ou plusieurs éléments de l'organe, ce qui entraîne un déplacement et une déformation très réaliste de l'ensemble ou d'une partie de la structure linguale. Dans une finalité de modélisation le plus proche possible de la réalité physiologique, il apparaît intéressant de prendre en compte non pas seulement la forme et la position statique des organes, mais aussi la dynamique du système en terme de vitesse de déplacement et d'inertie. Enfin, la prise en considération des effecteurs neuromusculaires à la source de ces mouvements permet d'atteindre un stade de modélisation très avancé comme dans le travail de Sanguinetti et al. (1998). Conclusion Dans le cadre de l'étude des dysarthries, des modèles comme ceux décrits précédemment, seraient d'un grand secours pour mieux appréhender des observations infiniment variables de production de parole, souvent opaques mais dont l'opacité pourrait alors se dissiper à la lumière d'un modèle physio-pathologique. De même, la synthèse artificielle de productions pathologiques pourrait permettre, d'une part de tester nos outils d'évaluation sur des matériaux parfaitement calibrés, d'autre part de fournir un outil pédagogique dans la formation des cliniciens et autres scientifiques préoccupés par les troubles de la voix et de la parole. cription serait parfaitement vaine si elle ne servait pas au moins de diagnostic, d'explication des mécanismes ou de généralisation du modèle. Dans la plupart des cas, les modèles peuvent être abordés sous la forme de schémas fonctionnels composés de blocs connectés par des lignes d'action. On y retrouve des variables d'entrée qui peuvent être les commandes du modèle, et des variables de résultats en sortie. Les blocs sont le moteur du modèle, intégrant la connaissance ou la description du phénomène modélisé. Selon l'approche choisie, ces boîtes peuvent s'avérer transparentes, si les connaissances sont explicitées ou alors totalement noires, sans capacité d'interprétation des mécanismes.
Fichier principal
Vignette du fichier
Chap11.modelisation_conduit.pdf (2.23 Mo) Télécharger le fichier
Origine : Accord explicite pour ce dépôt
Loading...

Dates et versions

hal-01616692 , version 1 (17-10-2017)

Identifiants

  • HAL Id : hal-01616692 , version 1

Citer

Alain Ghio. Modélisation du conduit vocal. Auzou P.; Rolland V.; Pinto S. ; Ozsancak C. Les dysarthries, Solal, 2007. ⟨hal-01616692⟩
153 Consultations
462 Téléchargements

Partager

Gmail Facebook X LinkedIn More