Skip to Main content Skip to Navigation
Conference papers

Prédiction a priori de la qualité de la transcription automatique de la parole bruitée

Résumé : De nombreuses sources de variabilité dégradent les performances d'un système de Reconnaissance Automatique de la Parole (RAP). Dans cette étude, les dégradations provoquées par le type et le niveau de bruit sont explorées afin de prédire a priori la qualité de la RAP, i.e. avant même le décodage. Notre méthode se fonde sur une séparation spectrale de la parole et du bruit afin de produire un modèle de régression. L'expérimentation a été réalisée sur le corpus Wall street Journal, bruité avec le corpus NOISEX-92 (17 types de bruit) que nous appliquons à 9 niveaux de rapport signal à bruit. La méthode de régression proposée obtient moins de 8% d'erreur moyenne entre le Word Error Rate (WER) prédit et le WER réellement obtenu par le système de transcription automatique de la parole.
Document type :
Conference papers
Complete list of metadata

Cited literature [16 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-02124434
Contributor : Open Archive Toulouse Archive Ouverte (OATAO) Connect in order to contact the contributor
Submitted on : Thursday, May 9, 2019 - 3:25:54 PM
Last modification on : Monday, July 4, 2022 - 8:50:33 AM
Long-term archiving on: : Thursday, October 10, 2019 - 10:23:41 AM

File

ferreira_22643.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-02124434, version 1
  • OATAO : 22643

Citation

Sébastien Ferreira, Jérome Farinas, Julien Pinquier, Stéphane Rabant. Prédiction a priori de la qualité de la transcription automatique de la parole bruitée. 32e Journées d'Etudes sur la Parole (JEP 2018), Jun 2018, Aix-En-Provence, France. pp.249-257. ⟨hal-02124434⟩

Share

Metrics

Record views

15

Files downloads

99