Scattering transform et réseaux convolutionels pour l'identification du locuteur - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Scattering transform et réseaux convolutionels pour l'identification du locuteur

Résumé

Les assistants vocaux sont devenus très populaires ces der-nières années. Les utilisateurs peuvent contrôler ces ap-pareils intelligents par la voix et obtenir divers services. Combinés à la biométrie, ces dispositifs peuvent permettre de distinguer des profils utilisateurs et sécuriser l'usage de l'appareil. Dans ce scénario, quelques segments de dis-cours de courte durée (2-4 sec.) sont utilisés pour l'au-thentification. Afin de limiter le nombre de paramètres utili-sés pour l'apprentissage, nous proposons de combiner une Wavelet Scattering Transform (ST) et un réseau convolutif (CNN). Nos expérimentations montrent que la combinaison ST/CNN extrait efficacement les caractéristiques de l'iden-tité du locuteur sur des discours de courte durée. Mots Clef Assistant vocal, identification du locuteur, réseau de neurones convolutifs, réseau hybride.
Fichier principal
Vignette du fichier
RFIAP_2020_paper_20.pdf (222.12 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02552042 , version 1 (23-04-2020)

Identifiants

  • HAL Id : hal-02552042 , version 1

Citer

Wajdi Ghezaiel, Luc Brun, Olivier Lézoray, Myriam Mokhtari. Scattering transform et réseaux convolutionels pour l'identification du locuteur. RFIAP (Reconnaissance des Formes, Image, Apprentissage et Perception), Jun 2020, Vannes, France. ⟨hal-02552042⟩
122 Consultations
464 Téléchargements

Partager

Gmail Facebook X LinkedIn More