Un modèle pour la recherche d’information sur des documents structurés

Abstract : Avec l’émergence de nouveaux standards comme le XHTML ou le DocBook où la structure des documents est apparente, la communauté de recherche d’information a commencé à s’intéresser à l’utilisation de cette nouvelle source d’information. La tâche est ardue, car il s’agit de concilier de sources d’informations de natures différentes, à savoir le texte et la structure. Quelques modèles ont fait leur apparition ; mais ces travaux manquent encore de maturité et n’utilisent la structure que d’une manière simple. Le cadre théorique que nous présentons dans ce papier a pour vocation de permettre une prise en compte de la structure dans les tâches de recherche documentaire et de catégorisation. Ce modèle basé sur l’utilisation de réseaux bayésiens est capable de s’adapter à de nouvelles bases de données grâce à des techniques d’apprentissage numérique. Il offre également des perspectives de développement intéressantes comme par exemple la navigation interactive dans une base de données.
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01357598
Contributor : Ludovic Denoyer <>
Submitted on : Tuesday, August 30, 2016 - 10:17:36 AM
Last modification on : Thursday, March 21, 2019 - 2:19:21 PM

Identifiers

  • HAL Id : hal-01357598, version 1

Citation

Benjamin Piwowarski, Ludovic Denoyer, Patrick Gallinari. Un modèle pour la recherche d’information sur des documents structurés. 6èmes Journées internationales d'Analyse statistique des Données Textuelles (JADT 2002), Mar 2002, Saint-Malo, France. ⟨hal-01357598⟩

Share

Metrics

Record views

97