A General Flexible Framework for the Handling of Prior Information in Audio Source Separation - Archive ouverte HAL Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2010

A General Flexible Framework for the Handling of Prior Information in Audio Source Separation

Résumé

Most of audio source separation methods are developed for a particular scenario characterized by the number of sources and channels and the characteristics of the sources and the mixing process. In this paper we introduce a general audio source separation framework based on a library of structured source models that enable the incorporation of prior knowledge about each source via user-specifiable constraints. While this framework generalizes several existing audio source separation methods, it also allows to imagine and implement new efficient methods that were not yet reported in the literature. We first introduce the framework by describing the model structure and constraints, explaining its generality, and summarizing its algorithmic implementation using a generalized expectation-maximization algorithm. Finally, we illustrate the above-mentioned capabilities of the framework by applying it in several new and existing configurations to different source separation problems.
La plupart des méthodes de séparation de sources audio sont développées pour un scénario particulier caractérisé par le nombre de sources et de capteurs, ainsi que par les propriétés des sources et du processus de mélange. Dans cet article, nous introduisons un cadre général pour la séparation de sources audio basé sur une librairie de modèles de sources structurés permettant l'exploitation des connaissances a priori sur chaque source à l'aide de contraintes spécifiées par l'utilisateur. Ce cadre généralise plusieurs méthodes de séparation de sources existantes et permet également d'imaginer et d'implémenter de nouvelles méthodes non étudiées dans la littérature. Nous introduisons le cadre proposé en décrivant la structure du modèle et des contraintes, en expliquant sa généralité, et en décrivant son implémentation par un algorithme de maximisation de l'espérance généralisé. Puis nous illustrons le potentiel de cette approche en l'appliquant à plusieurs problèmes de séparation de sources dans des configurations existantes et nouvelles.
Fichier principal
Vignette du fichier
RR-7453.pdf (742.14 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

inria-00536917 , version 1 (18-11-2010)
inria-00536917 , version 2 (29-11-2010)
inria-00536917 , version 3 (28-09-2011)

Identifiants

  • HAL Id : inria-00536917 , version 1

Citer

Alexey Ozerov, Emmanuel Vincent, Frédéric Bimbot. A General Flexible Framework for the Handling of Prior Information in Audio Source Separation. [Research Report] RR-7453, 2010, pp.37. ⟨inria-00536917v1⟩
266 Consultations
1313 Téléchargements

Partager

Gmail Facebook X LinkedIn More