Kodex ou comment organiser les résultats d'une recherche d'information par détection de communautés sur un graphe biparti ? - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Kodex or how to organize the results of a search for information by community detection on a bipartite graph?

Kodex ou comment organiser les résultats d'une recherche d'information par détection de communautés sur un graphe biparti ?

Résumé

Information Retrieval Systems (IRS) generally display results as a list of documents.One may think that a deeper structure exists within results. This hypothesis is reinforced bythe fact that most of the graphs produced from real data (e.g., graphs of documents) sharesome structural properties, and in particular a community structure. We propose to use theseproperties to better organize the set of returned documents for a query from a given IRS. For thispurpose, the retrieved document set is modeled as a bipartite graph (Documents ↔ Terms) onwhich the Kodex community detection algorithm is applied. This paper presents Kodex and itsevaluation : regarding F1 measure, Kodex overcomes baseline Okapi BM25 by 22%.
Les Systèmes de Recherche d’Information structurent en général leurs résultats sousla forme d’une liste de documents. Nous pensons qu’il existe une structure plus riche dansces résultats. En effet, la plupart des graphes obtenus à partir de données réelles (entre autre,les graphes de documents) partagent certaines propriétés structurelles, en particulier uneorganisation en communautés que nous proposons d’exploiter afin de mieux organiser l’ensembledes documents restitués pour une requête. Pour ce faire, l’ensemble des documents restitués estmodélisé par un graphe biparti (Documents ↔ Termes) sur lequel est appliqué notre algorithmeKodex de détection de communautés. Cet article présente Kodex et son évaluation : sur la mesureF1 , Kodex améliore significativement la baseline Okapi BM25 de 22 %.
Fichier principal
Vignette du fichier
kodex_coria_fr.2011.3.pdf (321.1 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00992072 , version 1 (26-05-2016)

Identifiants

  • HAL Id : hal-00992072 , version 1

Citer

Emmanuel Navarro, Yannick Chudy, Bruno Gaume, Guillaume Cabanac, Karen Sauvagnat. Kodex ou comment organiser les résultats d'une recherche d'information par détection de communautés sur un graphe biparti ?. Coria 2011 : Conférence en Recherche d'Information et Applications, Mar 2011, Avignon, France. pp.105--117. ⟨hal-00992072⟩
199 Consultations
182 Téléchargements

Partager

Gmail Facebook X LinkedIn More