1077 articles – 551 Notices  [english version]
HAL : pastel-00648997, version 1

Fiche détaillée  Récupérer au format
Télécom ParisTech (21/11/2011), Bertrand David (Dir.)
Décomposition de spectrogrammes musicaux informée par des modèles de synthèse spectrale. Modélisation des variations temporelles dans les éléments sonores.
Romain Hennequin 1, 2
(21/11/2011)

Cette thèse propose de nouvelles méthodes de décomposition automatique de spectrogrammes de signaux musicaux. Les décompositions proposées sont issues de la factorisation en matrices non-négatives (NMF), puissante technique de réduction de rang réputée pour fournir une décomposition sur un petit nombre de motifs fréquentiels automatiquement extraits des données ayant généralement un sens perceptif. La NMF ne permet cependant pas de modéliser de façon efficace certaines variations temporelles d'éléments sonores non-stationnaires communément rencontrées dans la musique. Cette thèse propose donc d'introduire dans la NMF des modèles génératifs de spectrogrammes musicaux basés sur des modèles classiques de synthèse sonore afin de pouvoir prendre en compte deux types de variations courantes : les variations d'enveloppe spectrale (sons d'instruments à cordes métalliques libres...) et les variations de fréquence fondamentale (vibrato, prosodie...). L'introduction de modèles de synthèse simples dans la NMF permet de proposer des décompositions capables de prendre en compte ces variations : l'utilisation d'un modèle de synthèse source/ filtre permet de modéliser les variations spectrales de certains objets musicaux au cours du temps. L'utilisation d'un modèle d'atomes harmoniques paramétriques inspiré de la synthèse additive ou bien l'utilisation d'un modèle inspiré de la synthèse par table d'onde qui utilise des transformations d'un unique atome de base afin de recréer toute la tessiture de chaque instrument permettent de modéliser les variations de fréquence fondamentale. Une application de séparation de sources et une de transformation sélective du son sont également présentées.
1 :  Département Traitement du Signal et des Images (TSI)
Télécom ParisTech – CNRS : UMR5141
2 :  Laboratoire Traitement et Communication de l'Information [Paris] (LTCI)
Télécom ParisTech – CNRS : UMR5141
AudioSig
Sciences de l'ingénieur/Traitement du signal et de l'image

Informatique/Traitement du signal et de l'image
Traitement du signal musical – Décomposition de spectrogrammes – Factorisation en matrices non-négatives – Séparation de sources audio
Liste des fichiers attachés à ce document : 
PDF
these.pdf(11.8 MB)