LeBenchmark, un référentiel d'évaluation pour le français oral * - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

LeBenchmark, un référentiel d'évaluation pour le français oral *

Sina Alisamir
  • Fonction : Auteur
Marco Dinarelli
Solène Evain
Natalia Tomashenko

Résumé

L'apprentissage autosupervisé a apporté des améliorations remarquables dans de nombreux domaines tels que la vision par ordinateur ou le traitement de la langue et de la parole, en exploitant de grandes quantités de données non étiquetées. Dans le contexte spécifique de la parole, cependant, et malgré des résultats prometteurs, il existe un manque évident de normalisation dans les processus d'évaluation permettant des comparaisons précises de ces modèles, en particulier pour les autres langues que l'anglais. Nous présentons ici à la communauté francophone LeBenchmark, un cadre de référence en sources ouvertes et reproductible pour évaluer des modèles autosupervisés à partir de corpus de parole en français. Il est composé de quatre tâches : reconnaissance automatique de la parole, compréhension du langage parlé, traduction automatique de la parole et reconnaissance automatique d'émotions. Nous encourageons la communauté francophone à utiliser ce référentiel dans ses futures expérimentations, notamment pour l'évaluation de modèles autosupervisés.
Fichier principal
Vignette du fichier
Le_Benchmark_JEP2022_part2_referenciel_evaluation-21.pdf (186.52 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03767742 , version 1 (02-09-2022)

Identifiants

  • HAL Id : hal-03767742 , version 1

Citer

Hang Le, Sina Alisamir, Marco Dinarelli, Fabien Ringeval, Solène Evain, et al.. LeBenchmark, un référentiel d'évaluation pour le français oral *. 34e Journées d'étude sur la parole JEP 2022, Jun 2022, île de Noirmoutier, France. ⟨hal-03767742⟩
251 Consultations
209 Téléchargements

Partager

Gmail Facebook X LinkedIn More