Détection et classification des sons : application aux sons de la vie courante et à la parole

Dan Istrate; Michel Vacher; Jean-Francois Serignat

Communication Dans Un Congrès Année : 2005

Détection et classification des sons : application aux sons de la vie courante et à la parole

(1) , (1) , (1)

Dan Istrate

Fonction : Auteur
PersonId : 170653
IdHAL : dan-istrate
ORCID : 0000-0001-5906-4947
IdRef : 077119800

Equipe GEOD, Groupe d'étude sur l'oral et le dialogue

Michel Vacher

Fonction : Auteur
PersonId : 709
IdHAL : michel-vacher
ORCID : 0000-0001-7770-9171
IdRef : 181831430

Equipe GEOD, Groupe d'étude sur l'oral et le dialogue

Jean-Francois Serignat

Fonction : Auteur

Equipe GEOD, Groupe d'étude sur l'oral et le dialogue

Résumé

Résumé – Depuis quelques années se développe le concept général d'espace perceptif (salle intelligente) qui répond de diverses façons aux besoins, demandes, attentes des acteurs humains. Un système d'extraction de l'information du son à trois étapes est proposé. La première étape permet la détection et l'extraction des sons du flux sonore continu. L'algorithme de détection proposé est basé sur la transformée en ondelettes, il permet de s'affranchir du bruit et d'obtenir une bonne résolution temporelle. La deuxième étape utilise un mélange de distributions de Gauss (GMM) pour faire la classification du signal sonore entre parole et sons et aiguiller le signal sur le processus adapté : reconnaissance de la parole (non traitée dans l'article) ou classification des sons. La troisième étape, celle de classification des sons de la vie courante, est aussi réalisée avec un système à base de GMM. Les paramètres acoustiques sont étudiés étant donné qu'ils ont une influence essentielle sur le système de classification ; par ailleurs, de nouveaux paramètres issus de la transformée en ondelettes sont proposés. Chaque étape de l'étude est validée au moyen d'un corpus spécifique. Abstract – Recently, the general concept of perceptive spaces or smart rooms is in a continuous development and tries to answer in different ways to the needs, demands or expectations of human actors. This paper presents a system to extract information from sound signals, which contains three stages. The first stage, sound event detection, takes care of the sound detection and extraction from a continuous acoustic flux and it uses an algorithm based on the wavelet transform. The algorithm described in the paper offers good temporal resolution and performances in a noisy environment. The second stage aims to the speech/sound classification and uses the Gaussian Mixtures Models (GMM). The third stage is also based on the GMM and realizes the classification of the everyday life sounds. The acoustical parameters are studied since they have an important influence on the classification performances. New parameters based on the wavelet transform are proposed. Every stage of the system is validated on a specific corpus.

Domaines

Autre [cs.OH]

Fichier principal

Detection_Classification.pdf (525.87 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Michel Vacher : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01092457

Soumis le : lundi 8 décembre 2014-17:04:30

Dernière modification le : jeudi 4 avril 2024-21:00:28

Archivage à long terme le : samedi 15 avril 2017-04:31:43

Dates et versions

hal-01092457 , version 1 (08-12-2014)

Identifiants

HAL Id : hal-01092457 , version 1

Citer

Dan Istrate, Michel Vacher, Jean-Francois Serignat. Détection et classification des sons : application aux sons de la vie courante et à la parole. 20ème colloque GRETSI : Traitement du Signal et des Images, Sep 2005, Louvain la Neuve, Belgium. pp.485-488. ⟨hal-01092457⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS LIG LIG_SIDCH

442 Consultations

70 Téléchargements

Détection et classification des sons : application aux sons de la vie courante et à la parole

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager