Identification Musicale à l'aide de Technologies Vocales

Résumé : L'identification musicale est un processus d'appariement d'un extrait de musique à un morceau de musique connu. Les applications d'un tel système sont multiples, comme la protection des droits d'au-teurs, ou plus simplement, permettre à un utilisateur d'identifier le morceau de musique qu'il écoute. Du fait des intérêts que peut présenter une telle application, plusieurs approches ont déjà été étudiées, le plus généralement basées sur des méthodes de reconnaissance des formes. Nous proposons d'utiliser les techniques de traitement automatique de la parole, efficaces dans des environnements difficiles. Notre approche est basée sur les mixtures de gaussiennes (GMM), et les modèles de Markov cachés (HMM) qui sont des concepts très usités dans les domaines du traitement de la parole. Nous avons appliqué à la musique une méthode de segmentation et de regroupement en locuteurs. Les résultats de nos travaux sont convainquants puisque notre système est résistant aux bruits et à la compression du signal. Avec 25 dB de bruit, nous obtenons 100% d'identification correcte en une seconde de signal. En encodant nos morceaux en MP3 à 56 kbits, nous obtenons un taux d'identification de 100% avec trois secondes de signal. Abstract Music identification is a matching process of an song snippet to a known song by the system. There are various use cases of a such system, as protection of copyright, or simply, allow a user to identify the piece of music he listens, and to retrieve information like the artist name or the album title. Because of the interest of a such an application, several approaches have already been studied, most commonly based on methods of pattern recognition. We propose to use speech processing techniques, effective in difficult environments. Our approach is based on Gaussian mixtures (GMM) and hidden Markov models (HMM), which are widely used concepts in the speech processing domain. We applied to the music a speakers type segmentation method. Our experiments demonstrate an identification accuracy of 100% with 25 dB of additive noise and with low bitrate encoded MP3, sugesting our system is resistant to noise and signal compression. Mots-clés : identification musicale, récupération d'information en fonction du contenu, acoustique, in-dexation, parole.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01318513
Contributor : Bibliothèque Universitaire Déposants Hal-Avignon <>
Submitted on : Thursday, May 19, 2016 - 4:17:46 PM
Last modification on : Wednesday, July 3, 2019 - 12:28:02 PM

Identifiers

  • HAL Id : hal-01318513, version 1

Collections

Citation

Hugo Mauchrétien, Georges Linares, Corinne Fredouille, Tania Jiménez. Identification Musicale à l'aide de Technologies Vocales. MajecSTIC 2009, Nov 2009, Avignon, France. ⟨hal-01318513⟩

Share

Metrics

Record views

37