Alignement sous-phrastique hiérarchique avec Anymalign - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Alignement sous-phrastique hiérarchique avec Anymalign

Résumé

Nous présentons un algorithme d'alignement sous-phrastique permettant d'aligner très facilement un couple de phrases à partir d'une matrice d'alignement pré-remplie. Cet algorithme s'inspire de travaux antérieurs sur l'alignement par segmentation binaire récursive ainsi que de travaux sur le clustering de documents. Nous évaluons les alignements produits sur des tâches de traduction automatique et montrons qu'il est possible d'atteindre des résultats du niveau de l'état de l'art, affichant des gains très conséquents allant jusqu'à plus de 4 points BLEU par rapport à nos travaux antérieurs, à l'aide une méthode très simple, indépendante de la taille du corpus à traiter, et produisant directement des alignements symétriques. En utilisant cette méthode en tant qu'extension à l'outil d'extraction de traductions Anymalign, nos expériences nous permettent de cerner certaines limitations de ce dernier et de définir des pistes pour son amélioration.
Fichier principal
Vignette du fichier
LardilleuxYvonLepage_TALN12.pdf (152.45 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00747398 , version 1 (31-10-2012)

Identifiants

  • HAL Id : hal-00747398 , version 1

Citer

Adrien Lardilleux, François Yvon, Yves Lepage. Alignement sous-phrastique hiérarchique avec Anymalign. 19e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2012), Jun 2012, Grenoble, France. pp.113-126. ⟨hal-00747398⟩
87 Consultations
85 Téléchargements

Partager

Gmail Facebook X LinkedIn More