simulation numérique du conduit vocal

Robert Espesser

Article Dans Une Revue Travaux interdisciplinaires du Laboratoire Parole et Langage Année : 1977

Digital simulation of the vocal tract

simulation numérique du conduit vocal

(1)

Robert Espesser

Fonction : Auteur
PersonId : 14655
IdHAL : robert-espesser
IdRef : 164943633

Laboratoire Parole et Langage

Résumé

We present a digital simulation of the vocal tract (VT) based on the model outlined in KELLY J., LOCHBAUM J. (1962) which consists in dividing the VT into a number of elementary tubes and calculating the propagation of the pressure wave through the successive junctions between these tubes. The dynamic performance of this model has been improved on the following points:
- the length changes of the VT -important in French- are taken into account.
- noise(cliks) produced during transitions (i.e. movements of the VT) have been reduced by means of a sufficiently fine linear interpolation between two target configurations.
The vocal source is an "oscillator" as defined in MUSIC V software and it is based on a "polynomial" glottal waveform. The time serie of the values of the fundamental frequency of this oscillator can be generated by software or can be natural values directly obtained from a pitch detector.
The system is implemented on a mini computer T1600 Télémécanique. The system is at present limited to the synthesis of oral and nasal french vowels (and transitions between them) and the quality of the synthesis is judged as good by listeners.

Nous présentons une simulation numérique du conduit vocal (CV) basée sur le modèle de Kelly et Lochbaum (1962), consistant à diviser le CV en une succession de petits tubes élémentaires et à calculer la propagation de l'onde de pression à travers les jonctions successives de ces tubes. Le comportement en dynamique de ce modèle a été amélioré sur les points suivants:
-les changements de longueur du CV -importants en français- sont pris en compte.
-les bruits (clics) produits durant les transitions (i.e. les mouvements du CV) entre deux configurations cibles ont été réduits au moyen d'une interpolation linéaire suffisamment fine entre les deux cibles.
La source vocale est un "oscillateur" au sens du logiciel MUSIC V et est basée sur une forme d'onde glottale dite "polynomiale". La série temporelle des valeurs de la fréquence fondamentale de cet oscillateur peut être générée par logiciel ou peut être une suite de valeurs obtenues d'un détecteur de fréquence fondamentale de la parole.
Le système est implanté sur un mini-ordinateur T1600 Télémécanique; il est à présent limité à la synthèse des voyelles orales et nasales du français (et des transitions entre elles) et la qualité de la synthèse est jugée satisfaisante par les auditeurs.

Mots clés

Speech Synthesis Vocal Tract

synthèse parole conduit vocal simulation

Domaines

Modélisation et simulation Acoustique [physics.class-ph] Informatique [cs]

Fichier principal

TIPA_propre.pdf (10.92 Mo)

Origine : Fichiers éditeurs autorisés sur une archive ouverte

robert espesser : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01649595

Soumis le : lundi 27 novembre 2017-15:58:20

Dernière modification le : mardi 9 mai 2023-13:52:37

Dates et versions

hal-01649595 , version 1 (27-11-2017)

Identifiants

HAL Id : hal-01649595 , version 1

Citer

Robert Espesser. simulation numérique du conduit vocal. Travaux interdisciplinaires du Laboratoire Parole et Langage, 1977, 4, pp.86-122. ⟨hal-01649595⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS UNIV-AMU TIPA LPL-AIX TDS-MACS

142 Consultations

47 Téléchargements

Digital simulation of the vocal tract

simulation numérique du conduit vocal

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Relations

Exporter

Collections

Partager