Application du critère BIC pour la segmentation en tours de chant - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Application du critère BIC pour la segmentation en tours de chant

Résumé

As part of a project on indexing ethno-musicological audio recordings (ANR CONTINT DIADEMS), determining singers and choirs automatically appeared to be essential and led us to reflect about the notion of “singer turns”. In this article, we report our first experiments in this direction by exploring a method based on the Bayesian Information Criterion (BIC) to detect singer turns. The BIC penalty coefficient was shown to vary when determining its value to achieve the best performance for each recording. In order to avoid the decision about which single value is best for all the documents, we propose a combination of several segmentations obtained with different values of this parameter. This method uses majority voting. A gain of 15% relative (7% absolute) in terms of F-measure was obtained compared to a single coefficient determined on a development sub-corpus.
Dans le cadre d’un projet sur l’indexation de documents ethnomusicologiques sonores (ANR CONTINT DIADEMS), le repérage des chanteurs et des chœurs est apparu comme essentiel et nous a amené à s’interroger sur la notion de « tours de chant ». Dans cet article, nous présentons nos premiers pas dans le domaine en proposant une méthode de segmentation fondée sur le Critère d’Information Bayésien (BIC) qui vise à détecter des changements de chanteurs dans des enregistrements musicaux. Le corpus de cette étude est composé d’enregistrements musicaux fournis par des ethnomusicologues et il nous permet d’illustrer l’importance du coefficient de pénalité du critère BIC : sa valeur optimale varie en fonction du contenu des enregistrements. Pour s’affranchir de l’apprentissage d’une unique valeur de ce paramètre, nous proposons de recueillir plusieurs segmentations pour plusieurs valeurs du paramètre et de consolider la détection a posteriori. Un gain relatif en termes de F-mesure, de 15% (7% absolu) est obtenu entre cette décision a posteriori et une décision prise après apprentissage du coefficient de pénalité.
Fichier principal
Vignette du fichier
Thlithi_13042.pdf (611.95 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03666010 , version 1 (12-05-2022)

Identifiants

  • HAL Id : hal-03666010 , version 1
  • OATAO : 13042

Citer

Marwa Thlithi, Thomas Pellegrini, Julien Pinquier, Régine André-Obrecht, Patrice Guyot. Application du critère BIC pour la segmentation en tours de chant. 30ème Journées d'Etudes sur la Parole (JEP 2014), Association Francophone de la Communication Parlée (AFCP); Laboratoire d'Informatique de Nantes Atlantique (LINA); Laboratoire d'Informatique de l'Université du Maine (LIUM), Jun 2014, Le Mans, France. pp.166-175. ⟨hal-03666010⟩
35 Consultations
33 Téléchargements

Partager

Gmail Facebook X LinkedIn More