Recherche documentaire par titrage automatique - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Recherche documentaire par titrage automatique

Résumé

Nous proposons dans cet article un système facilitant la recherche d'information dans un ensemble de documents textuels, basé sur le titrage (et sous-titrage) automatique. Ce dernier peut se révéler crucial, par exemple, dans le cadre de la problématique de l'accessibilité des pages web (norme W3C). Notre processus de titrage automatique consiste à extraire des syntagmes nominaux pertinents dans les textes, pouvant constituer des titres ou sous-titres candidats. Une approche originale combinant des critères statistiques et de placement des mots dans le texte permet alors de proposer des titres et sous-titres pertinents à un utilisateur sous forme de sommaire. L'utilisateur peut donc facilement prendre connaissance de l'ensemble des sujets évoqués dans une masse de documents, et aisément retrouver le document l'intéressant le cas échéant. Une évaluation sur des données réelles montre que les solutions fournies par notre approche de titrage automatique se révèlent tout à fait pertinentes.
Fichier principal
Vignette du fichier
Titrage.pdf (343.2 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

lirmm-00637968 , version 1 (03-11-2011)

Identifiants

  • HAL Id : lirmm-00637968 , version 1

Citer

Cédric Lopez, Violaine Prince, Mathieu Roche. Recherche documentaire par titrage automatique. INFORSID'11 - 29ème Edition, May 2011, Lille, France. pp.217-232. ⟨lirmm-00637968⟩
182 Consultations
68 Téléchargements

Partager

Gmail Facebook X LinkedIn More