Degré de comparabilité, extraction lexicale bilingue et recherche d'information interlingue

Résumé : Nous étudions dans cet article le problème de la comparabilité des documents composant un corpus comparable afin d'améliorer la qualité des lexiques bilingues extraits et les performances des systèmes de recherche d'information interlingue. Nous proposons une nouvelle approche qui permet de garantir un certain degré de comparabilité et d'homogénéité du corpus tout en préservant une grande part du vocabulaire du corpus d'origine. Nos expériences montrent que les lexiques bilingues que nous obtenons sont d'une meilleure qualité que ceux obtenus avec les approches précédentes, et qu'ils peuvent être utilisés pour améliorer significativement les systèmes de recherche d'information interlingue.
Type de document :
Communication dans un congrès
Mathieu Lafourcade, Violaine Prince. TALN 2011 - Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France. LIRMM Montpellier, 1, pp.211-222, 2011
Liste complète des métadonnées


https://hal.archives-ouvertes.fr/hal-00608471
Contributeur : Emmanuel Morin <>
Soumis le : mercredi 13 juillet 2011 - 11:06:15
Dernière modification le : mercredi 24 juin 2015 - 11:00:41
Document(s) archivé(s) le : lundi 12 novembre 2012 - 11:00:22

Fichier

Li_taln11_submission_50.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00608471, version 1

Citation

Li Bo, Éric Gaussier, Emmanuel Morin, Amir Hazem. Degré de comparabilité, extraction lexicale bilingue et recherche d'information interlingue. Mathieu Lafourcade, Violaine Prince. TALN 2011 - Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France. LIRMM Montpellier, 1, pp.211-222, 2011. <hal-00608471>

Partager

Métriques

Consultations de
la notice

331

Téléchargements du document

160