Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole

Laurent Besacier; Benjamin Lecouteux; Ngoc Luong Quang

Communication Dans Un Congrès Année : 2015

Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole

(1) , (1) , (1)

Laurent Besacier

Fonction : Auteur correspondant
PersonId : 1521
IdHAL : laurent-besacier
ORCID : 0000-0001-7411-9125
IdRef : 079377017

Connectez-vous pour contacter l'auteur

Laboratoire d'Informatique de Grenoble

Benjamin Lecouteux

Fonction : Auteur
PersonId : 7847
IdHAL : benjamin-lecouteux
ORCID : 0000-0003-3000-6190
IdRef : 135355060

Laboratoire d'Informatique de Grenoble

Ngoc Luong Quang

Fonction : Auteur

Laboratoire d'Informatique de Grenoble

Résumé

Les mesures de confiance au niveau mot (Word Confidence Estimation-WCE) pour la traduction auto-matique (TA) ou pour la reconnaissance automatique de la parole (RAP) attribuent un score de confiance à chaque mot dans une hypothèse de transcription ou de traduction. Dans le passé, l'estimation de ces mesures a le plus souvent été traitée séparément dans des contextes RAP ou TA. Nous proposons ici une estimation conjointe de la confiance associée à un mot dans une hypothèse de traduction automatique de la parole (TAP). Cette estimation fait appel à des paramètres issus aussi bien des systèmes de transcription de la parole (RAP) que des systèmes de traduction automatique (TA). En plus de la construction de ces estimateurs de confiance robustes pour la TAP, nous utilisons les informations de confiance pour re-décoder nos graphes d'hypothèses de traduction. Les expérimentations réalisées montrent que l'utilisation de ces mesures de confiance au cours d'une seconde passe de décodage permettent d'obtenir une amélioration significative des performances de traduction (évaluées avec la métrique BLEU-gains de deux points par rapport à notre système de traduc-tion de parole de référence). Ces expériences sont faites pour une tâche de TAP (français-anglais) pour laquelle un corpus a été spécialement conçu (ce corpus, mis à la disposition de la communauté TALN, est aussi décrit en détail dans l'article). Abstract. Word Confidence Estimation (WCE) for machine translation (MT) or automatic speech recognition (ASR) assigns a confidence score to each word in the MT or ASR hypothesis. In the past, this task has been treated separately in ASR or MT contexts and we propose here a joint estimation of word confidence for a spoken language translation (SLT) task involving both ASR and MT. We build robust word confidence estimators for SLT, based on joint ASR and MT features. Using these word confidence measures to re-decode the spoken language translation graph leads to a significant BLEU improvement (2 points) compared to the SLT baseline. These experiments are done for a French-English SLT task for which a corpus was specifically designed (this corpus being made available to the NLP community). Mots-clés : Mesures de confiance, traduction automatique de la parole, paramètres joints, re-décodage de graphe.

Mots clés

Word confidence estimation (WCE) Spoken language translation (SLT) Joint features Search graph re-decoding

Domaines

Informatique et langage [cs.CL]

Fichier principal

taln-2015-besacier.pdf (181.16 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Laurent Besacier : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01150044

Soumis le : vendredi 8 mai 2015-08:14:13

Dernière modification le : jeudi 4 avril 2024-21:36:18

Archivage à long terme le : mercredi 19 avril 2017-19:57:14

Dates et versions

hal-01150044 , version 1 (08-05-2015)

Identifiants

HAL Id : hal-01150044 , version 1

Citer

Laurent Besacier, Benjamin Lecouteux, Ngoc Luong Quang. Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole. Traitement Automatique du Langage Naturel (TALN), Jun 2015, Caen, France. ⟨hal-01150044⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS LIG LIG_TDCGE_GETALP POLYTECH-GRENOBLE LIG_SIDCH

114 Consultations

215 Téléchargements

Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager