Apport d'un corpus comparable déséquilibré à l'extraction de lexiques bilingues - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

Apport d'un corpus comparable déséquilibré à l'extraction de lexiques bilingues

Résumé

The main work in bilingual lexicon extraction from comparable corpora is based on the implicit hypothesis that corpora are balanced. However, the different related approaches are relatively insensitive to sizes of each part of the comparable corpus. Within this context, we study the influence of unbalanced comparable corpora on the quality of bilingual terminology extraction through different experiments. Our results show the conditions under which the use of an unbalanced comparable corpus can induce a significant gain in the quality of extracted lexicons.
Fichier principal
Vignette du fichier
taln09-final.pdf (93.07 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00417704 , version 1 (16-09-2009)

Identifiants

  • HAL Id : hal-00417704 , version 1

Citer

Emmanuel Morin. Apport d'un corpus comparable déséquilibré à l'extraction de lexiques bilingues. 16ème conférence sur le Traitement Automatique des Langues Naturelles (TALN), Jun 2009, Senlis, France. ⟨hal-00417704⟩
90 Consultations
63 Téléchargements

Partager

Gmail Facebook X LinkedIn More