Méthodologie pour une représentation multi-dimensionnelle des documents - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Méthodologie pour une représentation multi-dimensionnelle des documents

Benjamin Piwowarski

Résumé

La représentation des documents et questions en Recherche d'Information (RI) est restée une représentation majoritairement uni-dimensionnelle (i.e., vecteur). Cette représentation a des limites : Comment par exemple représenter un document qui traitent de plusieurs thèmes ou une question ambiguë ? Ces problèmes sont importants pour développer des systèmes de RI interactifs ou cherchant à diversifier les résultats. Les modèles actuels sont soit basés sur des heuristiques, soit sur des modèles latents tels que LDA (Latent Dirichlet Allocation) qui pré-supposent un nombre limités de thèmes pour décrire les documents. L'approche basée sur les probabilités dites " quantiques " permet d'établir des bases formelles pour une représentation multi-dimensionnelle des documents (ou plus généralement, des objets d'information) qui dépasse les limites évoquées plus haut. Cet article décrit la méthodologie QIA (Quantum Information Access) pour la représentation des documents, résume les résultats expérimentaux obtenus et décrit les perspectives.
Fichier principal
Vignette du fichier
qia-coria13.pdf (1.08 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00788414 , version 1 (14-02-2013)

Identifiants

  • HAL Id : hal-00788414 , version 1

Citer

Benjamin Piwowarski. Méthodologie pour une représentation multi-dimensionnelle des documents. CORIA 2013 - 10ème COnférence en Recherche d'Information et Applications, Apr 2013, Neuchâtel, Suisse. pp.227-236. ⟨hal-00788414⟩
92 Consultations
190 Téléchargements

Partager

Gmail Facebook X LinkedIn More