Résumé Automatiques de Textes avec un algorithme d'ordonnancement - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2005

Résumé Automatiques de Textes avec un algorithme d'ordonnancement

Résumé

Dans cet article, nous proposons une nouvelle approche pour le résumé automatique de textes utilisant un algorithme d'apprentissage numérique spécifique à la tâche d'ordonnancement. L'objectif est d'extraire les phrases d'un document qui sont les plus représentatives de son contenu. Pour se faire, chaque phrase d'un document est représentée par un vecteur de scores de pertinence, où chaque score est un score de similarité entre une requête particulière et la phrase considérée. L'algorithme d'ordonnancement effectue alors une combinaison linéaire de ces scores, avec pour but d'affecter aux phrases pertinentes d'un document des scores supérieurs à ceux des phrases non pertinentes du même document. Les algorithmes d'ordonnancement ont montré leur efficacité en particulier dans le domaine de la méta-recherche, et leur utilisation pour le résumé est motivée par une analogie peut être faite entre la méta-recherche et le résumé automatique qui consiste, dans notre cas, à considérer les similarités des phrases avec les différentes requêtes comme étant des sorties de différents moteurs de recherche. Nous montrons empiriquement que l'algorithme d'ordonnancement a de meilleures performances qu'une approche utilisant un algorithme de classification sur deux corpus distincts.
Fichier non déposé

Dates et versions

hal-01490504 , version 1 (15-03-2017)

Identifiants

  • HAL Id : hal-01490504 , version 1

Citer

Nicolas Usunier, Massih-Reza Amini, Patrick Gallinari. Résumé Automatiques de Textes avec un algorithme d'ordonnancement. CORIA 2005 - 2ème Conférence en Recherche d'Informations et Applications, Mar 2005, Grenoble, France. pp.25-40. ⟨hal-01490504⟩
55 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More