Large-scale classification of musical tracks according to the presence of singing voice
Classification à grande échelle de morceaux de musique en fonction de la présence de chant
Résumé
Le chant est un élément remarquable d’une chanson et sa détection automatique au sein d’un morceau est un défi largement étudié. Cet article propose une approche permettant de discriminer les titres musicaux comportant du chant dans une base de données musicales conséquente.
L’approche précédemment proposée par Ghosal et al.[9] fonde la prise de décision sur l’analyse des descripteurs à l’échelle de la chanson. Nous générons ici une probabilité de présence de chant à l’échelle de la trame afin de prendre une décision globale. Une première méthode proposée pour cette classification utilise la densité de probabilité des prédictions et une seconde des n-grammes sur les trames supposées contenir du chant.
Les résultats de ces nouvelles méthodes améliorent ceux obtenus par [9] et montrent une meilleure robustesse lorsque la taille de la base musicale augmente. La précision de la classification chute ainsi de 3.6% seulement contre 13.1% pour [9] lorsque la base de test est multipliée par 16.
Origine : Fichiers éditeurs autorisés sur une archive ouverte