Méthode Structurée de décomposition en matrices non- négatives appliquéè a la séparation de sources audio

Résumé : Dans cet article, nous proposons une méthode structurée de décomposition en matrices non-négatives visant a utiliser la structure multi-couche des signaux audio. Les signaux audio peuvent etre vus comme une superposition de deux couches : la couche tonale (modélisée par des sommes de sinuso¨des evoluant lentement en fréquence et en temps) et la couche transitoire (les sons percussifs, ´ ev enements de courtes durées etalés en fréquence). Notre méthode décompose une partie du signal en composantes orthogonales parcimonieuses, bien adaptées pour l'extraction tonale tandis que la partie transitoire est représentée par des bases de décomposition classiques. Les résultats de séparation de sources obtenus sur des signaux réels de musique ont montré que notre approche obtient des résultats similaires a ceux de l'´ etat de l'art. Abstract – In this paper, we propose a new unconstrained nonnegative matrix factorization method designed to utilize the multilayer structure of audio signals to improve the quality of the source separation. The tonal layer is sparse in frequency and temporally stable, while the transient layer is composed of short term broadband sounds. Our method has a part well suited for tonal extraction which decomposes the signals in sparse orthogonal components, while the transient part is represented by a regular nonnegative matrix factorization decomposition. Experiments on real music data in a source separation context show that such decomposition is suitable for audio signal. Compared with three state-of-the-art harmonic/percussive decomposition algorithms, the proposed method shows competitive performances.
Document type :
Conference papers
Complete list of metadatas

Cited literature [10 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01199648
Contributor : Matthieu Kowalski <>
Submitted on : Tuesday, September 15, 2015 - 5:20:29 PM
Last modification on : Thursday, October 17, 2019 - 12:36:09 PM
Long-term archiving on : Tuesday, December 29, 2015 - 7:22:18 AM

File

Laroche_gretsi.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01199648, version 1

Citation

Clément Laroche, Matthieu Kowalski, Hélène Papadopoulos, Gaël Richard. Méthode Structurée de décomposition en matrices non- négatives appliquéè a la séparation de sources audio. 25eme Colloque GRETSI 2015, Sep 2015, Lyon, France. ⟨hal-01199648⟩

Share

Metrics

Record views

545

Files downloads

360