Détection et classification des sons : application aux sons de la vie courante et à la parole - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2005

Détection et classification des sons : application aux sons de la vie courante et à la parole

Résumé

Résumé – Depuis quelques années se développe le concept général d'espace perceptif (salle intelligente) qui répond de diverses façons aux besoins, demandes, attentes des acteurs humains. Un système d'extraction de l'information du son à trois étapes est proposé. La première étape permet la détection et l'extraction des sons du flux sonore continu. L'algorithme de détection proposé est basé sur la transformée en ondelettes, il permet de s'affranchir du bruit et d'obtenir une bonne résolution temporelle. La deuxième étape utilise un mélange de distributions de Gauss (GMM) pour faire la classification du signal sonore entre parole et sons et aiguiller le signal sur le processus adapté : reconnaissance de la parole (non traitée dans l'article) ou classification des sons. La troisième étape, celle de classification des sons de la vie courante, est aussi réalisée avec un système à base de GMM. Les paramètres acoustiques sont étudiés étant donné qu'ils ont une influence essentielle sur le système de classification ; par ailleurs, de nouveaux paramètres issus de la transformée en ondelettes sont proposés. Chaque étape de l'étude est validée au moyen d'un corpus spécifique. Abstract – Recently, the general concept of perceptive spaces or smart rooms is in a continuous development and tries to answer in different ways to the needs, demands or expectations of human actors. This paper presents a system to extract information from sound signals, which contains three stages. The first stage, sound event detection, takes care of the sound detection and extraction from a continuous acoustic flux and it uses an algorithm based on the wavelet transform. The algorithm described in the paper offers good temporal resolution and performances in a noisy environment. The second stage aims to the speech/sound classification and uses the Gaussian Mixtures Models (GMM). The third stage is also based on the GMM and realizes the classification of the everyday life sounds. The acoustical parameters are studied since they have an important influence on the classification performances. New parameters based on the wavelet transform are proposed. Every stage of the system is validated on a specific corpus.

Domaines

Autre [cs.OH]
Fichier principal
Vignette du fichier
Detection_Classification.pdf (525.87 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01092457 , version 1 (08-12-2014)

Identifiants

  • HAL Id : hal-01092457 , version 1

Citer

Dan Istrate, Michel Vacher, Jean-Francois Serignat. Détection et classification des sons : application aux sons de la vie courante et à la parole. 20ème colloque GRETSI : Traitement du Signal et des Images, Sep 2005, Louvain la Neuve, Belgium. pp.485-488. ⟨hal-01092457⟩
442 Consultations
70 Téléchargements

Partager

Gmail Facebook X LinkedIn More