Approches quantitatives de l'analyse des prédictions en traduction automatique neuronale (TAN)
Résumé
As part of a larger project on optimal learning conditions in neural machine translation, we investigate characteristic training phases of translation engines. All our experiments are carried out using OpenNMT-Py: the pre-processing step is implemented using the Europarl training corpus and the INTERSECT corpus is used for validation. Longitudinal analyses of training phases suggest that the progression of translations is not always linear. Following the results of textometric explorations, we identify the importance of the phenomena related to chronological progression, in order to map different processes at work in neural machine translation (NMT).
Dans le cadre d’un projet plus vaste consacré à l’analyse des conditions d’apprentissage optimales pour la traduction, nous cherchons à identifier des phases caractéristiques de l’entraînement des moteurs de traduction neuronaux. Nos expériences ont été réalisées avec OpenNMT-Py. Le pré-traitement a été effectué sur le corpus d’entraînement Europarl et le corpus de validation INTERSECT. Les analyses longitudinales des différentes phases d’entraînement suggèrent que la progression des traductions n’y est pas toujours linéaire. Les analyses textométriques des volets montrent l’importance des phénomènes liés à la progression chronologique et permettent établir progressivement une cartographie des processus à l’œuvre dans la traduction automatique neuronale (TAN).
Origine : Fichiers produits par l'(les) auteur(s)