Modélisation des paramètres de contrôle pour la synthèse de voix chantée

L Ardaillon 1, * Axel Roebel 1 Céline Chabot-Canet 2, 1
* Auteur correspondant
1 Analyse et synthèse sonores [Paris]
STMS - Sciences et Technologies de la Musique et du Son
Résumé : L'état de l'art de la synthèse vocale, et en particulier la synthèse concaténative , nous permet a ce jour d'obtenir une qualité d'élocution proche de la voix réelle, aussi bien pour la parole que pour le chant. Mais une synthèse a la fois naturelle et expressive ne peut être conçue sans un contrôle approprié, recouvrant de nombreux aspects a la fois timbraux et prosodiques, ainsi que leurs interdépendances. Pour le chant, la fréquence fondamentale (F0), portant la mélodie ainsi que certains aspects stylistiques, est a considérer en premier lieu. Une méthode de modélisation de la courbe de F0 a partir de la partition, basée sur l'utilisation de B-splines, a été mise en place. Celle-ci permet une représentation paramétrique des variations expressives de la F0 telles que le vibrato, les attaques, ou les transitions entre notes, avec un contrôle intuitif. Une première étude a permis d'établir qu'une telle représentation permet de reproduire de façon satisfaisante les variations propres a différents styles de chant. Mais le réglage manuel de l'ensemble des paramètres reste une tâche fastidieuse. Une gestion automatique de ces paramètres, basée sur un apprentissage et certaines règles, s'avère donc nécessaire, afin de réduire la quantité de réglages manuels a fournir. Les différents paramètres considérés varient d'un style de chant a l'autre. L'extraction de ces paramètres a partir d'enregistrements, ainsi que des contextes liés a la partition, doit donc permettre de capturer les caractéristiques propres au style interprétatif du chanteur, tout en conservant une certaine variabilité et la cohérence nécessaires a la production d'un chant naturel.
Type de document :
Communication dans un congrès
CFA / VISHNO 2016, Apr 2016, Le Mans, France. Actes du 13e Congrès Français d'Acoustique, 2016, 〈http://cfa2016.univ-lemans.fr/fr/index.html〉
Liste complète des métadonnées

Littérature citée [14 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01352278
Contributeur : Luc Ardaillon <>
Soumis le : dimanche 7 août 2016 - 14:26:53
Dernière modification le : jeudi 20 juillet 2017 - 09:26:52
Document(s) archivé(s) le : mardi 8 novembre 2016 - 17:54:15

Fichier

000451.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01352278, version 1

Collections

Citation

L Ardaillon, Axel Roebel, Céline Chabot-Canet. Modélisation des paramètres de contrôle pour la synthèse de voix chantée. CFA / VISHNO 2016, Apr 2016, Le Mans, France. Actes du 13e Congrès Français d'Acoustique, 2016, 〈http://cfa2016.univ-lemans.fr/fr/index.html〉. 〈hal-01352278〉

Partager

Métriques

Consultations de la notice

194

Téléchargements de fichiers

39