L'alignement sous-phrastique multilingue pour les nuls - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

L'alignement sous-phrastique multilingue pour les nuls

Résumé

L'alignement sous-phrastique consiste à extraire des traductions d'unités textuelles de grain inférieur à la phrase à partir de textes multilingues dont les phrases ont préalablement été mises en correspondance. Les méthodes les plus répandues actuellement, bien que produisant des résultats de grande qualité, sont complexes, supportent difficilement le passage à l'échelle, et ne peuvent traiter les langues que par couples. Elles mettent généralement l'accent sur les mots fréquents. Nous présentons une approche radicalement différente, tirant parti des mots rares. Elle permet l'alignement d'un nombre quelconque de langues simultanément et un passage à l'échelle naturel, tout en demeurant d'une grande simplicité.
Fichier principal
Vignette du fichier
majecstic09-lardilleux.pdf (92.84 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00439810 , version 1 (08-12-2009)

Identifiants

  • HAL Id : hal-00439810 , version 1

Citer

Adrien Lardilleux. L'alignement sous-phrastique multilingue pour les nuls. 7e Manifestation des Jeunes Chercheurs en Sciences et Technologies de l'Information et de la Communication, Nov 2009, Avignon, France. ⟨hal-00439810⟩
114 Consultations
242 Téléchargements

Partager

Gmail Facebook X LinkedIn More