Traduire des corpus pour construire des modèles de traduction neuronaux : une solution pour toutes les langues peu dotées ? - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Traduire des corpus pour construire des modèles de traduction neuronaux : une solution pour toutes les langues peu dotées ?

Résumé

Nous comparons deux usages des langues pivots en traduction automatique neuronale pour des langues peu dotées. Nous nous intéressons au cas où il existe une langue pivot telle que les paires source-pivot et pivot-cible sont bien ou très bien dotées. Nous comparons la traduction séquentielle traditionnelle (source→pivot→cible) et la traduction à l’aide d’un modèle entraîné sur des corpus traduits à l’aide des langues pivot et cible. Les expériences sont menées sur trois langues sources (espagnol, allemand et japonais), une langue pivot (anglais) et une langue cible (français). Nous constatons que quelle que soit la proximité linguistique entre les langues source et pivot, le modèle entraîné sur corpus traduit a de meilleurs résultats que la traduction séquentielle, et bien sûr que la traduction directe.
Fichier principal
Vignette du fichier
148.pdf (608.94 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02784765 , version 1 (07-06-2020)
hal-02784765 , version 2 (18-06-2020)
hal-02784765 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02784765 , version 3

Citer

Raoul Blin. Traduire des corpus pour construire des modèles de traduction neuronaux : une solution pour toutes les langues peu dotées ?. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, 2020, Nancy, France. pp.172-180. ⟨hal-02784765v3⟩
225 Consultations
121 Téléchargements

Partager

Gmail Facebook X LinkedIn More