Résumé Automatiques de Textes avec un algorithme d'ordonnancement

Résumé : Dans cet article, nous proposons une nouvelle approche pour le résumé automatique de textes utilisant un algorithme d'apprentissage numérique spécifique à la tâche d'ordonnancement. L'objectif est d'extraire les phrases d'un document qui sont les plus représentatives de son contenu. Pour se faire, chaque phrase d'un document est représentée par un vecteur de scores de pertinence, où chaque score est un score de similarité entre une requête particulière et la phrase considérée. L'algorithme d'ordonnancement effectue alors une combinaison linéaire de ces scores, avec pour but d'affecter aux phrases pertinentes d'un document des scores supérieurs à ceux des phrases non pertinentes du même document. Les algorithmes d'ordonnancement ont montré leur efficacité en particulier dans le domaine de la méta-recherche, et leur utilisation pour le résumé est motivée par une analogie peut être faite entre la méta-recherche et le résumé automatique qui consiste, dans notre cas, à considérer les similarités des phrases avec les différentes requêtes comme étant des sorties de différents moteurs de recherche. Nous montrons empiriquement que l'algorithme d'ordonnancement a de meilleures performances qu'une approche utilisant un algorithme de classification sur deux corpus distincts.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01490504
Contributor : Lip6 Publications <>
Submitted on : Wednesday, March 15, 2017 - 2:22:24 PM
Last modification on : Thursday, March 21, 2019 - 1:04:52 PM

Identifiers

  • HAL Id : hal-01490504, version 1

Citation

Nicolas Usunier, Massih-Reza Amini, Patrick Gallinari. Résumé Automatiques de Textes avec un algorithme d'ordonnancement. CORIA 2005 - 2ème Conférence en Recherche d'Informations et Applications, Mar 2005, Grenoble, France. pp.25-40. ⟨hal-01490504⟩

Share

Metrics

Record views

50