Accurate and Effective Latent Concept Modeling for Ad Hoc Information Retrieval

Abstract : A keyword query is the representation of the information need of a user, and is the result of a complex cognitive process which often results in under-specification. We propose an unsupervised method namely Latent Concept Modeling (LCM) for mining and modeling latent search concepts in order to recreate the conceptual view of the original information need. We use Latent Dirichlet Allocation (LDA) to exhibit highly-specific query-related topics from pseudo-relevant feedback documents. We define these topics as the latent concepts of the user query. We perform a thorough evaluation of our approach over two large ad-hoc TREC collections. Our findings reveal that the proposed method accurately models latent concepts, while being very effective in a query expansion retrieval setting.
Type de document :
Article dans une revue
Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2014, pp.61-84. 〈10.3166/DN.17.1.61-84〉
Liste complète des métadonnées

Littérature citée [44 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01002716
Contributeur : Romain Deveaud <>
Soumis le : vendredi 6 juin 2014 - 15:59:42
Dernière modification le : mercredi 12 septembre 2018 - 01:27:45
Document(s) archivé(s) le : samedi 6 septembre 2014 - 12:21:08

Fichier

DN.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Collections

Citation

Romain Deveaud, Eric Sanjuan, Patrice Bellot. Accurate and Effective Latent Concept Modeling for Ad Hoc Information Retrieval. Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2014, pp.61-84. 〈10.3166/DN.17.1.61-84〉. 〈hal-01002716〉

Partager

Métriques

Consultations de la notice

1468

Téléchargements de fichiers

1302