BM25t : une extension de BM25 pour la Recherche d'Information ciblée - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 2010

BM25t : une extension de BM25 pour la Recherche d'Information ciblée

Mathias Géry
  • Fonction : Auteur correspondant
  • PersonId : 843869

Connectez-vous pour contacter l'auteur
Christine Largeron
Thollard Franck
  • Fonction : Auteur
  • PersonId : 881368

Résumé

Cet article traite de l'intégration des balises XML dans la fonction de pondération des termes, pour la Recherche d'Information (RI) XML ciblée. Notre modèle permet de considérer un certain type d'information structurelle : les balises qui représentent la structure logique des documents (titre, section, paragraphe, etc.), ainsi que les balises liées à la mise en forme (gras, italique, centré, etc.). Nous prenons en compte l'influence des balises sous forme d'un poids en estimant la probabilité pour une balise de mettre en évidence les termes pertinents. Ensuite, ces poids sont intégrés à la fonction de pondération des termes. Des expérimentations sur une collection de grande taille dans le cadre de la compétition de RI XML, INEX 2008, ont montré une amélioration de la qualité des résultats en RI ciblée.
Fichier principal
Vignette du fichier
Gery_Largeron_Thollard_doc_num_v_finale.pdf (399.17 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00531162 , version 1 (02-11-2010)

Identifiants

  • HAL Id : hal-00531162 , version 1

Citer

Mathias Géry, Christine Largeron, Thollard Franck. BM25t : une extension de BM25 pour la Recherche d'Information ciblée. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2010, 13 (1), pp.83-110. ⟨hal-00531162⟩
200 Consultations
471 Téléchargements

Partager

Gmail Facebook X LinkedIn More