Amélioration de la traduction automatique d'un corpus annoté - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Improvement of the automatic translation of an annotated corpus

Amélioration de la traduction automatique d'un corpus annoté

Résumé

Improvement of the automatic translation of an annotated corpus In this article, we present a method to improve the automatic translation of an annotated corpus and transfer its annotations from English to any target language. The idea is to improve method of (Nasirud-din et al., 2015) which leads to many untranslated segments, duplications and disorders. We propose a pre-treatment process for the English SemCor, to adapt it to the statistical machine translation system, as well as a post-treatment process for the output of SMT. We show an increase of 2,9 points in terms of F1 score on a Word Sense Disambiguation task which proves the effectiveness of our method.
Dans cet article, nous présentons une méthode pour améliorer la traduction automatique d'un corpus annoté et porter ses annotations de l'anglais vers une langue cible. Il s'agit d'améliorer la méthode de (Nasiruddin et al., 2015) qui donnait de nombreux segments non traduits, des duplications et des désordres. Nous proposons un processus de pré-traitement du SemCor anglais, pour qu'il soit adapté au système de traduction automatique statistique utilisé, ainsi qu'un processus de post-traitement pour la sortie. Nous montrons une augmentation de 2,9 points en terme de score F1 sur une tâche de désambiguïsation lexicale ce qui prouve l'efficacité de notre méthode.
Fichier principal
Vignette du fichier
T63.pdf (1.96 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-01680553 , version 1 (16-01-2018)

Identifiants

  • HAL Id : hal-01680553 , version 1

Citer

Marwa Hadj Salah, Hervé Blanchon, Mounir Zrigui, Didier Schwab. Amélioration de la traduction automatique d'un corpus annoté. JEP-TALN-RECITAL 2016, Jul 2016, Paris, France. ⟨hal-01680553⟩
120 Consultations
56 Téléchargements

Partager

Gmail Facebook X LinkedIn More