Classification de signaux audio en temps-réel par un modèle de mélanges d'histogrammes

Maxime Baelde; Christophe Biernacki; Raphaël Greff

Communication Dans Un Congrès Année : 2017

Classification de signaux audio en temps-réel par un modèle de mélanges d'histogrammes

(1, 2, 3) , (1) , (3)

1
2
3

Maxime Baelde

Fonction : Auteur
PersonId : 1017368

Laboratoire Paul Painlevé - UMR 8524

MOdel for Data Analysis and Learning

A-Volute [Roubaix]

Christophe Biernacki

Fonction : Auteur
PersonId : 853117

Laboratoire Paul Painlevé - UMR 8524

Raphaël Greff

Fonction : Auteur

A-Volute [Roubaix]

Résumé

Audio recognition consists in giving a label to an unknown audio signal. It relies on audio descriptors and machine learning algorithms. However, in a real-time context with heterogeneous sounds, the current models lack of performance to classify sounds. This article presents a novel method based on a model of histogram mixture representing audio spectra. The recognition consists in computing the probability of each group and aggregate them temporally. A reduction step of the models allows also to perform this algorithm in real-time. This method outperforms current state-of-the-art algorithms, and achieves an accuracy of 96,7% on a database of 50 classes, using only 0.5s of audio data.

La reconnaissance sonore consiste à attribuer un label à un signal audio inconnu. Celle-ci repose généralement sur des descripteurs audio ainsi que des modèles d'apprentissage statistique. Néanmoins les modèles actuels peinent à bien classer les sons dans un contexte temps-réel où ces derniers sont hétérogènes. Ce papier propose une nouvelle méthode basée sur un modèle de mélanges d'histogrammes représentant les spectres audio. La reconnaissance consiste à calculer la probabilité de chaque groupe puis à les agréger temporellement. Une étape de réduction du précédent modèle permet par ailleurs de passer au temps-réel. Cette méthode surpasse les algorithmes actuels, et peut atteindre 96,7% de bonne classification sur une base de 50 classes de sons en utilisant 0,5s de données audio.

Mots clés

temps-réel classification audio Modèle de mélanges machine learning

Domaines

Machine Learning [stat.ML]

Fichier principal

Article JDS 2017.pdf (266.12 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Maxime Baelde : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01592496

Soumis le : lundi 25 septembre 2017-08:44:29

Dernière modification le : vendredi 19 avril 2024-14:04:05

Archivage à long terme le : mardi 26 décembre 2017-12:55:53

Dates et versions

hal-01592496 , version 1 (25-09-2017)

Identifiants

HAL Id : hal-01592496 , version 1

Citer

Maxime Baelde, Christophe Biernacki, Raphaël Greff. Classification de signaux audio en temps-réel par un modèle de mélanges d'histogrammes. JDS 2017 - 49e Journées de Statistiques, May 2017, Avignon, France. ⟨hal-01592496⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA INRIA2 UNIV-LILLE LPP-MATH

170 Consultations

902 Téléchargements

Classification de signaux audio en temps-réel par un modèle de mélanges d'histogrammes

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager