Modèles d'information pour la recherche multilingue

Bo Li 1 Éric Gaussier 1, *
* Auteur correspondant
Abstract : We present in this paper well-founded cross-language extensions of the recently introduced models in the information-based family for information retrieval, namely the LL (loglogistic) and SPL (smoothed power law) models of (Clinchant et al., 2010). These extensions are based on (a) a generalization of the notion of information used in the information-based family, (b) a generalization of the random variables also used in this family, and (c) the direct expansion of query terms with their translations. We then review these extensions from a theoretical point-of-view, prior to assessing them experimentally. The results of the experimental comparisons between these extensions and existing CLIR systems, on three collections and three language pairs, reveal that the cross-language extension of the LL model provides a state-of-the-art CLIR system, yielding the best performance overall.
Type de document :
Communication dans un congrès
Michel Beigbeder, Véronique Eglin, Nicolas Ragot, Mathias Géry. CORIA 2012 - COnférence en Recherche d'Information et Applications, Mar 2012, Bordeaux, France. pp.9-24, 2012
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-00741697
Contributeur : Eric Gaussier <>
Soumis le : lundi 15 octobre 2012 - 10:03:46
Dernière modification le : mardi 28 octobre 2014 - 18:35:10
Document(s) archivé(s) le : samedi 17 décembre 2016 - 00:58:02

Fichier

Li-coria2012.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00741697, version 1

Citation

Bo Li, Éric Gaussier. Modèles d'information pour la recherche multilingue. Michel Beigbeder, Véronique Eglin, Nicolas Ragot, Mathias Géry. CORIA 2012 - COnférence en Recherche d'Information et Applications, Mar 2012, Bordeaux, France. pp.9-24, 2012. <hal-00741697>

Partager

Métriques

Consultations de
la notice

166

Téléchargements du document

103