Alignement de termes de longueurs variables en corpus comparables spécialisés

Jingshu Liu 1, 2 Emmanuel Morin 2 Sebastián Saldarriaga 1
2 TALN - Traitement Automatique du Langage Naturel
LS2N - Laboratoire des Sciences du Numérique de Nantes
Résumé : Nous proposons dans cet article une adaptation de l'approche compositionnelle étendue capable d'aligner des termes de longueurs variables à partir de corpus comparables, en modifiant la représen-tation des termes complexes. Nous proposons également de nouveaux modes de pondération pour l'approche standard qui améliorent les résultats des approches état de l'art pour les termes simples et complexes en domaine de spécialité. ABSTRACT Alignment of variable length terms in specialized comparable corpora We propose in this paper an adaptation of the extended compositional approach able to align terms of variable lengths from comparable corpora, by modifying the representation of complex terms. We also propose new weighting modes for the standard approach that improve the results of state-of-the-art approaches for simple and complex terms in specialised domains. MOTS-CLÉS : Multilinguisme, alignement, corpus comparables, vecteur de contexte.
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-02001678
Contributor : Jingshu Liu <>
Submitted on : Thursday, January 31, 2019 - 12:01:49 PM
Last modification on : Tuesday, March 26, 2019 - 9:25:22 AM

File

Alignement_de_termes_de_longue...
Files produced by the author(s)

Identifiers

  • HAL Id : hal-02001678, version 1

Collections

Citation

Jingshu Liu, Emmanuel Morin, Sebastián Saldarriaga. Alignement de termes de longueurs variables en corpus comparables spécialisés. Actes de la 25e conférence sur le Traitement Automatique des Langues Naturelles (TALN), May 2018, Rennes, France. ⟨hal-02001678⟩

Share

Metrics

Record views

33

Files downloads

9