Approches quantitatives de l'analyse des prédictions en traduction automatique neuronale (TAN) - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Approches quantitatives de l'analyse des prédictions en traduction automatique neuronale (TAN)

Résumé

As part of a larger project on optimal learning conditions in neural machine translation, we investigate characteristic training phases of translation engines. All our experiments are carried out using OpenNMT-Py: the pre-processing step is implemented using the Europarl training corpus and the INTERSECT corpus is used for validation. Longitudinal analyses of training phases suggest that the progression of translations is not always linear. Following the results of textometric explorations, we identify the importance of the phenomena related to chronological progression, in order to map different processes at work in neural machine translation (NMT).
Dans le cadre d’un projet plus vaste consacré à l’analyse des conditions d’apprentissage optimales pour la traduction, nous cherchons à identifier des phases caractéristiques de l’entraînement des moteurs de traduction neuronaux. Nos expériences ont été réalisées avec OpenNMT-Py. Le pré-traitement a été effectué sur le corpus d’entraînement Europarl et le corpus de validation INTERSECT. Les analyses longitudinales des différentes phases d’entraînement suggèrent que la progression des traductions n’y est pas toujours linéaire. Les analyses textométriques des volets montrent l’importance des phénomènes liés à la progression chronologique et permettent établir progressivement une cartographie des processus à l’œuvre dans la traduction automatique neuronale (TAN).
Fichier principal
Vignette du fichier
JADT2020_Zimina_Ballier_Yunes.pdf (535.16 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03049589 , version 1 (09-12-2020)

Identifiants

Citer

Maria Zimina-Poirot, Nicolas Ballier, Jean-Baptiste Yunès. Approches quantitatives de l'analyse des prédictions en traduction automatique neuronale (TAN). JADT 2020 : 15èmes Journées Internationales d'Analyse statistique des Données Textuelles, Université de Toulouse, Jun 2020, Toulouse, France. ⟨hal-03049589⟩
55 Consultations
80 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More