Exploration de la traduction automatique neuronale espagnol-français : Pour une traductologie de corpus appliquée à l'analyse des outils de traduction - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Revue de Traduction et Langues Année : 2021

Exploring Spanish-French Neural Machine Translation: Towards a Corpus-Based Translation Studies Approach for the Analysis of Translation Tools

Exploration de la traduction automatique neuronale espagnol-français : Pour une traductologie de corpus appliquée à l'analyse des outils de traduction

Résumé

Neural machine translation (NMT) systems, based on large volumes of bilingual and monolingual data, represent a significant leap forward in the processing of linguistic data. In some professional settings, they are becoming a complementary tool for translation. The challenge is therefore to know the advantages and weaknesses of their use, which would make it possible to approach the post-editing phase more effectively. From a textometric and translation studies approach, this article proposes the exploration of a translation corpus composed of journalistic texts in Spanish and their translations into French by the generic NMT system DeepL. A sample of the most frequent lexemes in the corpus was qualitatively analysed using the MkAlign software in order to evaluate the output of the automatic information transfer. The analysis indicates that, in most cases, the information content of the lexemes studied was correctly transferred into the target language. Furthermore, appropriate translation choices were revealed when processing anaphoric expressions. However, the target text contains transfer errors concerning some neologisms, proper names and parasynonyms.
Les systèmes de traduction automatique dite neuronale (TAN), basées sur de grandes masses de données bilingues et monolingues, représentent un saut qualitatif dans le traitement des données linguistiques. Dans certains milieux professionnels, ils se généralisent et deviennent ainsi un véritable outil de traduction. L’enjeu est donc de connaître les avantages et les faiblesses de leur utilisation, ce qui permettrait d’aborder la phase de post-édition de manière plus efficace. Cet article, fondé sur une approche textométrique et traductologique, propose l’exploration d’un corpus parallèle constitué de textes journalistiques en espagnol et de leur traduction en français réalisée par le système générique de TAN DeepL. Un échantillon formé des lexèmes les plus fréquents du corpus a été analysé qualitativement à l’aide du logiciel MkAlign dans le but d’évaluer le résultat du transfert automatique d’informations. L’analyse indique que, dans la majorité des cas, le contenu informationnel concernant les lexèmes étudiés a été correctement transféré en langue cible. De plus, ont été mis en évidence des choix de traduction pertinents au moment du traitement d’expressions anaphoriques. Cependant, le texte cible comporte des erreurs de transfert concernant certains néologismes, des noms propres et des parasynonymes.

Domaines

Linguistique
Fichier principal
Vignette du fichier
ARTICLE. Exploration de la traduction automatique neuronale espagnol-français.pdf (1.17 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03698221 , version 1 (17-06-2022)

Identifiants

  • HAL Id : hal-03698221 , version 1

Citer

Cristian Valdez, Maria Lomeña Galiano. Exploration de la traduction automatique neuronale espagnol-français : Pour une traductologie de corpus appliquée à l'analyse des outils de traduction. Revue de Traduction et Langues, 2021, 20 (1), p. 85-111. ⟨hal-03698221⟩
107 Consultations
106 Téléchargements

Partager

Gmail Facebook X LinkedIn More