BiTermEx Un prototype d'extraction de mots composés à partir de documents comparables via la méthode compositionnelle - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

BiTermEx Un prototype d'extraction de mots composés à partir de documents comparables via la méthode compositionnelle

Résumé

We describe BiTermEx, a prototype for extracting multiword terms from comparable corpora, using the compositional method. We focus on morphology-based variations of multiword constituents and their recombinaison. We experimented our approach on scientific and popular science corpora. We record TOP1 precisions of 92% and 97,5% on French to English alignments and 94% on French to Japanese.
Fichier principal
Vignette du fichier
TALN_2012_EP_Final_PrA_sentation.pdf (118.14 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00727813 , version 1 (04-09-2012)

Identifiants

  • HAL Id : hal-00727813 , version 1

Citer

Emmanuel Planas. BiTermEx Un prototype d'extraction de mots composés à partir de documents comparables via la méthode compositionnelle. Proceedings of the Joint Conference JEP-TALN-RECITAL 2012, volume 2: TALN, Sep 2012, Grenoble, France, France. pp.415-422. ⟨hal-00727813⟩
83 Consultations
64 Téléchargements

Partager

Gmail Facebook X LinkedIn More