Une nouvelle mesure de la réverbération pour prédire les performances a priori de la transcription de la parole - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Une nouvelle mesure de la réverbération pour prédire les performances a priori de la transcription de la parole

Résumé

Dans cette étude, nous explorons la prédiction a priori de la qualité de la transcription automatique de la parole dans le cas de la parole réverbérée enregistrée avec un seul microphone. Cette prédiction est faite avant le décodage pour informer les utilisateurs de la qualité de la transcription attendue. Dans cette étude, nous nous concentrons uniquement sur les pertes de performance liées à la réverbération. Une nouvelle mesure de réverbération appelée « Excitation Behavior » est introduite. Cette mesure exploite le résidus de la prédiction linéaire sur les fenêtres voisées du signal de parole. L’expérience a été menée sur le corpus Wall Street Journal, réverbéré par des réponses impulsionnelles provenant du REVERB Challenge. Par rapport aux autres mesures de réverbération testées, notre mesure obtient une amélioration relative de 20% de la prédiction du taux d’erreur (aussi bien au niveau des phonèmes que des mots).
Fichier principal
Vignette du fichier
56.pdf (709.57 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02798541 , version 1 (07-06-2020)
hal-02798541 , version 2 (18-06-2020)
hal-02798541 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02798541 , version 3

Citer

Sébastien Ferreira, Jérôme Farinas, Julien Pinquier, Julie Mauclair, Stéphane Rabant. Une nouvelle mesure de la réverbération pour prédire les performances a priori de la transcription de la parole. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, 2020, Nancy, France. pp.226-234. ⟨hal-02798541v3⟩
274 Consultations
76 Téléchargements

Partager

Gmail Facebook X LinkedIn More