L'alignement sous-phrastique multilingue pour les nuls
Résumé
L'alignement sous-phrastique consiste à extraire des traductions d'unités textuelles de grain inférieur à la phrase à partir de textes multilingues dont les phrases ont préalablement été mises en correspondance. Les méthodes les plus répandues actuellement, bien que produisant des résultats de grande qualité, sont complexes, supportent difficilement le passage à l'échelle, et ne peuvent traiter les langues que par couples. Elles mettent généralement l'accent sur les mots fréquents. Nous présentons une approche radicalement différente, tirant parti des mots rares. Elle permet l'alignement d'un nombre quelconque de langues simultanément et un passage à l'échelle naturel, tout en demeurant d'une grande simplicité.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...