Combinaison de ressources générales pour une contextualisation implicite de requêtes

Résumé : RÉSUMÉ L'utilisation de sources externes d'informations pour la recherche documentaire a été considéra-blement étudiée dans le passé. Des améliorations de performances ont été mises en lumière avec des corpus larges ou structurés. Néanmoins, dans ces études les ressources sont souvent utilisées séparément mais rarement combinées. Nous présentons une évaluation de la combinaison de quatre différentes ressources générales, standards et accessibles. Nous utilisons une mesure de distance informative pour extraire les caractéristiques contextuelles des différentes ressources et améliorer la représentation de la requête. Cette évaluation est menée sur une tâche de recherche d'information sur le Web en utilisant le corpus ClueWeb09 et les topics de la piste Web de TREC. Les meilleurs résultats sont obtenus en combinant les quatre ressources, et sont statistiquement significativement supérieurs aux autres approches. ABSTRACT Query Contextualization and Reformulation by Combining External Corpora Improving document retrieval using external sources of information has been extensively studied throughout the past. Improvements with either structured or large corpora have been reported. However, in these studies resources are often used separately and rarely combined together. We present an evaluation of the combination of four different scalable corpora over a web search task. An informative divergence measure is used to extract contextual features from the corpora and improve query representation. We use the ClueWeb09 collection along with TREC's Web Track topics for the purpose of our evaluation. Best results are achieved when combining all four corpora, and are significantly better than the results of other approaches. MOTS-CLÉS : Combinaison de ressources, RI contextuelle, recherche web.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01314905
Contributor : Bibliothèque Universitaire Déposants Hal-Avignon <>
Submitted on : Thursday, May 12, 2016 - 12:34:06 PM
Last modification on : Tuesday, April 2, 2019 - 2:03:40 AM

Identifiers

  • HAL Id : hal-01314905, version 1

Citation

Romain Deveaud, Patrice Bellot. Combinaison de ressources générales pour une contextualisation implicite de requêtes. TALN, Jun 2012, Grenoble, France. ⟨hal-01314905⟩

Share

Metrics

Record views

97