Une méthode contextuelle d'extension de requête avec des groupements de mots pour le résumé automatique

Résumé : Dans cet article nous décrivons les différentes étapes de construction du système de résumé extractif du LIP6 utilisé lors de la compétition Document Understanding Conferences (DUC2007). Ce système repose sur un module d’extension des mots de la question et du titre de chacun des sujets par des concepts de mots trouvés automatiquement avec un algorithme d’apprentissage non-supervisé. Cet algorithme est une version classifiante de l’algorithme EM. Chaque phrase des documents de la collection est ensuite caractérisée par un vecteur représentant les similarités de la phrase avec le titre, la question ainsi que leur version étendue. Le score final des phrases est alors trouvé en combinant manuellement ces similarités sur la base DUC 2006. Les résultats obtenus lors de cette compétition place le LIP6 respectivement 3eme, 2eme et 1ere suivant les trois mesures officielles de la compétition.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01299225
Contributor : Lip6 Publications <>
Submitted on : Thursday, April 7, 2016 - 1:42:10 PM
Last modification on : Thursday, March 21, 2019 - 1:13:05 PM

Identifiers

  • HAL Id : hal-01299225, version 1

Citation

Jean-François Pessiot, Young-Min Kim, Massih-Reza Amini, Nicolas Usunier, Patrick Gallinari. Une méthode contextuelle d'extension de requête avec des groupements de mots pour le résumé automatique. Conference en Recherche d'information et Applications, CORIA 2008, Mar 2008, Trégastel, France. pp.289-304. ⟨hal-01299225⟩

Share

Metrics

Record views

62