Multi­alignement vs bi­alignement : à plusieurs, c’est mieux ! - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Multi­alignement vs bi­alignement : à plusieurs, c’est mieux !

Résumé

Abstract. Multi­alignment vs bi­alignment: the more languages the better In this paper, we propose an original method for performing the alignment of a multi­parallel corpus, ie a parallel corpus involving more than two languages, taking into account all the languages simultaneously (and not by merging a series of independent bi­alignments). To do this, we rely on the networks of lexical correspondences formed by identical chains and cognates (related words), and we show how various tiling of language pairs allow to exploit the surface similarities due to genetic relationships between languages. We evaluate our method compared to a conventional method of bi­alignment, and show how the multi­alignement achieves both more accurate and robust results.
Dans cet article, nous proposons une méthode originale destinée à effectuer l'alignement d'un corpus multi­parallèle, i.e. comportant plus de deux langues, en prenant en compte toutes les langues simultanément (et non en composant une série de bi­alignements indépendants). Pour ce faire, nous nous appuyons sur les réseaux de correspondances lexicales constitués par les transfuges (chaînes identiques) et cognats (mots apparentés), et nous montrons comment divers tuilages des couples de langues permettent d'exploiter au mieux les ressemblances superficielles liées aux relations génétiques interlinguistiques. Nous évaluons notre méthode par rapport à une méthode de bi­alignement classique, et montrons en quoi le multi­alignement permet d'obtenir des résultats à la fois plus précis et plus robustes.
Fichier principal
Vignette du fichier
taln-2015-long-022.pdf (580.63 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02068395 , version 1 (14-03-2019)

Identifiants

  • HAL Id : hal-02068395 , version 1

Citer

Olivier Kraif. Multi­alignement vs bi­alignement : à plusieurs, c’est mieux !. TALN 2015, 22e conférence sur le Traitement automatique des langues naturelles, Jun 2015, Caen, France. ⟨hal-02068395⟩

Collections

LIDILEM
25 Consultations
47 Téléchargements

Partager

Gmail Facebook X LinkedIn More