Towards a unified framework for bilingual terminology extraction of single-word and multi-word terms

Amir Hazem 1 Emmanuel Morin 1
1 TALN - Traitement Automatique du Langage Naturel
LS2N - Laboratoire des Sciences du Numérique de Nantes
Abstract : Extracting a bilingual terminology for multi-word terms from comparable corpora has not been widely researched. In this work we propose a unified framework for aligning bilingual terms independently of the term lengths. We also introduce some enhancements to the context-based and the neural network based approaches. Our experiments show the effectiveness of our enhancements over previous works and that the system can be adapted in specialized domains. Title and Abstract in French Vers un système unifié pour l'extraction terminologique bilingue de termes simples et complexes L'extraction d'une terminologie bilingue pour les termes complexesàcomplexes`complexesà partir de corpus compa-rables n'a pasétépas´pasété beaucoupétudiéebeaucoup´beaucoupétudiée. Dans ce travail, nous proposons un système unifié pour l'alignement des termes bilingues indépendamment de la longueur des termes. De plus nous in-troduisonségalementtroduisons´troduisonségalement des améliorations aux approches basées sur l'alignement de contexte et sur un réseau neuronal. Nos expériences montrent l'efficacité de nos améliorations sur les travaux antérieurs, et le fait que le système peutêtrepeutˆpeutêtre adapté en domaines de spécialité.
Type de document :
Communication dans un congrès
Proceedings of the 27th International Conference on Computational Linguistics (COLING), Aug 2018, Santa Fe, United States. pp.2855 - 2866
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-02001789
Contributeur : Amir Hazem <>
Soumis le : jeudi 31 janvier 2019 - 13:14:59
Dernière modification le : vendredi 15 février 2019 - 10:31:04

Identifiants

  • HAL Id : hal-02001789, version 1

Collections

Citation

Amir Hazem, Emmanuel Morin. Towards a unified framework for bilingual terminology extraction of single-word and multi-word terms. Proceedings of the 27th International Conference on Computational Linguistics (COLING), Aug 2018, Santa Fe, United States. pp.2855 - 2866. 〈hal-02001789〉

Partager

Métriques

Consultations de la notice

38