Résumé Automatiques de Textes avec un algorithme d'ordonnancement

Nicolas Usunier; Massih-Reza Amini; Patrick Gallinari

Communication Dans Un Congrès Année : 2005

Résumé Automatiques de Textes avec un algorithme d'ordonnancement

(1) , (1) , (1)

Nicolas Usunier

Fonction : Auteur
PersonId : 933831

Machine Learning and Information Retrieval

Massih-Reza Amini

Fonction : Auteur
PersonId : 747054
IdHAL : massih-reza-amini
ORCID : 0000-0001-9032-4233
IdRef : 132277042

Machine Learning and Information Retrieval

Patrick Gallinari

Fonction : Auteur
PersonId : 751615
IdHAL : patrick-gallinari
ORCID : 0000-0001-9060-9001
IdRef : 070709076

Machine Learning and Information Retrieval

Résumé

Dans cet article, nous proposons une nouvelle approche pour le résumé automatique de textes utilisant un algorithme d'apprentissage numérique spécifique à la tâche d'ordonnancement. L'objectif est d'extraire les phrases d'un document qui sont les plus représentatives de son contenu. Pour se faire, chaque phrase d'un document est représentée par un vecteur de scores de pertinence, où chaque score est un score de similarité entre une requête particulière et la phrase considérée. L'algorithme d'ordonnancement effectue alors une combinaison linéaire de ces scores, avec pour but d'affecter aux phrases pertinentes d'un document des scores supérieurs à ceux des phrases non pertinentes du même document. Les algorithmes d'ordonnancement ont montré leur efficacité en particulier dans le domaine de la méta-recherche, et leur utilisation pour le résumé est motivée par une analogie peut être faite entre la méta-recherche et le résumé automatique qui consiste, dans notre cas, à considérer les similarités des phrases avec les différentes requêtes comme étant des sorties de différents moteurs de recherche. Nous montrons empiriquement que l'algorithme d'ordonnancement a de meilleures performances qu'une approche utilisant un algorithme de classification sur deux corpus distincts.

Domaines

Informatique [cs]

Lip6 Publications : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01490504

Soumis le : mercredi 15 mars 2017-14:22:24

Dernière modification le : jeudi 14 mars 2024-14:40:45

Dates et versions

hal-01490504 , version 1 (15-03-2017)

Identifiants

HAL Id : hal-01490504 , version 1

Citer

Nicolas Usunier, Massih-Reza Amini, Patrick Gallinari. Résumé Automatiques de Textes avec un algorithme d'ordonnancement. CORIA 2005 - 2ème Conférence en Recherche d'Informations et Applications, Mar 2005, Grenoble, France. pp.25-40. ⟨hal-01490504⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UPMC CNRS LIP6 SORBONNE-UNIVERSITE SU-SCIENCES

55 Consultations

0 Téléchargements

Résumé Automatiques de Textes avec un algorithme d'ordonnancement

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager