LeBenchmark, un référentiel d'évaluation pour le français oral *

Hang Le; Sina Alisamir; Marco Dinarelli; Fabien Ringeval; Solène Evain; Ha Nguyen; Marcely Zanon Boito; Salima Mdhaffar; Ziyi Tong; Natalia Tomashenko; Titouan Parcollet; Alexandre Allauzen; Yannick Estève; Benjamin Lecouteux; François Portet; Solange Rossato; Didier Schwab; Laurent Besacier

Communication Dans Un Congrès Année : 2022

LeBenchmark, un référentiel d'évaluation pour le français oral *

(1) , (2) , (1) , (1) , (1) , (3) , (3) , (3) , (1) , (3) , (3) , (4) , (3) , (1) , (1) , (1) , (5) , (6)

1
2
3
4
5
6

Hang Le

Fonction : Auteur

Laboratoire d'Informatique de Grenoble

Sina Alisamir

Fonction : Auteur

Atos Bull

Marco Dinarelli

Fonction : Auteur
PersonId : 12699
IdHAL : marco-dinarelli
IdRef : 22461939X

Laboratoire d'Informatique de Grenoble

Fabien Ringeval

Fonction : Auteur

Laboratoire d'Informatique de Grenoble

Solène Evain

Fonction : Auteur
PersonId : 737268
IdHAL : solene-evain
ORCID : 0000-0003-1766-8894

Laboratoire d'Informatique de Grenoble

Ha Nguyen

Fonction : Auteur

Laboratoire Informatique d'Avignon

Marcely Zanon Boito

Fonction : Auteur

Laboratoire Informatique d'Avignon

Salima Mdhaffar

Fonction : Auteur

Laboratoire Informatique d'Avignon

Ziyi Tong

Fonction : Auteur

Laboratoire d'Informatique de Grenoble

Natalia Tomashenko

Fonction : Auteur
PersonId : 17002
IdHAL : natalia-tomashenko
IdRef : 223393304

Laboratoire Informatique d'Avignon

Titouan Parcollet

Fonction : Auteur

Laboratoire Informatique d'Avignon

Alexandre Allauzen

Fonction : Auteur

Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision

Yannick Estève

Fonction : Auteur

Laboratoire Informatique d'Avignon

Benjamin Lecouteux

Fonction : Auteur
PersonId : 7847
IdHAL : benjamin-lecouteux
ORCID : 0000-0003-3000-6190
IdRef : 135355060

Laboratoire d'Informatique de Grenoble

François Portet

Fonction : Auteur

Laboratoire d'Informatique de Grenoble

Solange Rossato

Fonction : Auteur

Laboratoire d'Informatique de Grenoble

Didier Schwab

Fonction : Auteur
PersonId : 4261
IdHAL : didier-schwab
ORCID : 0000-0002-2462-8148
IdRef : 069192359

Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole

Laurent Besacier

Fonction : Auteur

Naver Labs Europe [Meylan]

Résumé

L'apprentissage autosupervisé a apporté des améliorations remarquables dans de nombreux domaines tels que la vision par ordinateur ou le traitement de la langue et de la parole, en exploitant de grandes quantités de données non étiquetées. Dans le contexte spécifique de la parole, cependant, et malgré des résultats prometteurs, il existe un manque évident de normalisation dans les processus d'évaluation permettant des comparaisons précises de ces modèles, en particulier pour les autres langues que l'anglais. Nous présentons ici à la communauté francophone LeBenchmark, un cadre de référence en sources ouvertes et reproductible pour évaluer des modèles autosupervisés à partir de corpus de parole en français. Il est composé de quatre tâches : reconnaissance automatique de la parole, compréhension du langage parlé, traduction automatique de la parole et reconnaissance automatique d'émotions. Nous encourageons la communauté francophone à utiliser ce référentiel dans ses futures expérimentations, notamment pour l'évaluation de modèles autosupervisés.

Mots clés

Automatic Speech Recognition Self-Supervised Learning Speech Language Understanding Speech Translation Automatic Emotion Recognition

Référentiel d'évaluation Modèles Autosupervisés Reconnaissance Automatique Evaluation

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

Le_Benchmark_JEP2022_part2_referenciel_evaluation-21.pdf (186.52 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Didier Schwab : Connectez-vous pour contacter le contributeur

https://hal.science/hal-03767742

Soumis le : vendredi 2 septembre 2022-11:12:19

Dernière modification le : vendredi 19 avril 2024-16:18:54

Archivage à long terme le : samedi 3 décembre 2022-18:55:30

Dates et versions

hal-03767742 , version 1 (02-09-2022)

Identifiants

HAL Id : hal-03767742 , version 1

Citer

Hang Le, Sina Alisamir, Marco Dinarelli, Fabien Ringeval, Solène Evain, et al.. LeBenchmark, un référentiel d'évaluation pour le français oral *. 34e Journées d'étude sur la parole JEP 2022, Jun 2022, île de Noirmoutier, France. ⟨hal-03767742⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-AVIGNON UGA CNRS UNIV-DAUPHINE LIG LIG_TDCGE_GETALP LAMSADE-DAUPHINE PSL LIA MIAI ANR LIG_SIDCH

251 Consultations

209 Téléchargements

LeBenchmark, un référentiel d'évaluation pour le français oral *

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager