Amélioration de la traduction automatique d'un corpus annoté

Résumé : Dans cet article, nous présentons une méthode pour améliorer la traduction automatique d'un corpus annoté et porter ses annotations de l'anglais vers une langue cible. Il s'agit d'améliorer la méthode de (Nasiruddin et al., 2015) qui donnait de nombreux segments non traduits, des duplications et des désordres. Nous proposons un processus de pré-traitement du SemCor anglais, pour qu'il soit adapté au système de traduction automatique statistique utilisé, ainsi qu'un processus de post-traitement pour la sortie. Nous montrons une augmentation de 2,9 points en terme de score F1 sur une tâche de désambiguïsation lexicale ce qui prouve l'efficacité de notre méthode.
Type de document :
Communication dans un congrès
JEP-TALN-RECITAL 2016, Jul 2016, Paris, France. Actes de la conférence conjointe JEP-TALN-RECITAL 2016, volume 2 : TALN
Liste complète des métadonnées

Littérature citée [6 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01680553
Contributeur : Marwa Hadj Salah <>
Soumis le : mardi 16 janvier 2018 - 11:41:31
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03
Document(s) archivé(s) le : mercredi 23 mai 2018 - 17:54:43

Fichier

T63.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01680553, version 1

Collections

Citation

Marwa Hadj Salah, Hervé Blanchon, Mounir Zrigui, Didier Schwab. Amélioration de la traduction automatique d'un corpus annoté. JEP-TALN-RECITAL 2016, Jul 2016, Paris, France. Actes de la conférence conjointe JEP-TALN-RECITAL 2016, volume 2 : TALN. 〈hal-01680553〉

Partager

Métriques

Consultations de la notice

172

Téléchargements de fichiers

52