Exploration de systèmes end-to-end pour la reconnaissance automatique de la parole spontanée

Ces dernières années, les systèmes de Reconnaissance Automatique de la Parole (RAP) ont donné de très bons résultats sur les benchmarks de la communauté. Si ces résultats sont très bons sur la parole lue ou médiatique, les performances baissent considérablement pour la Reconnaissance de la Parole Spontanée (RAPS), notamment à cause de la faible disponibilité des corpus et de la difficulté de définir et de modéliser ce type de parole. Dans ce travail, nous souhaitons explorer l’utilisation d’un modèle neuronal pour la RAPS. En effet, l’optimisation end-to-end (de bout en bout) de ces modèles – sans modèle de langue a priori et en partie sans corpus annoté – offre non seulement des performances intéressantes, mais également l’opportunité d’étudier la modélisation de la parole spontanée uniquement à partir de données.

Mots clés

automatic speech recognition end-to-end system automatic speech recognition

système end-to-end parole spontanée système end-to-end

Domaines

Informatique et langage [cs.CL] Intelligence artificielle [cs.AI]

Fichier principal

Poster_GDR_LIFT_2021(2).pdf (97.34 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Solène Evain : Connectez-vous pour contacter le contributeur

https://hal.science/hal-03474959

Soumis le : lundi 3 janvier 2022-12:33:22

Dernière modification le : jeudi 4 avril 2024-18:24:58

Archivage à long terme le : lundi 4 avril 2022-18:12:36

Dates et versions

hal-03474959 , version 1 (03-01-2022)

Identifiants

HAL Id : hal-03474959 , version 1

Citer

Solène Evain, Solange Rossato, Benjamin Lecouteux, François Portet. Exploration de systèmes end-to-end pour la reconnaissance automatique de la parole spontanée. GDR LIFT 2021, Dec 2021, Grenoble, France. ⟨hal-03474959⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS LIG LIG_TDCGE_GETALP MIAI ANR LIG_SIDCH

39 Consultations

28 Téléchargements