Deft 2011: appariements de résumés et d'articles scientifiques fondés sur des distributions de chaînes de caractères - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Deft 2011: appariements de résumés et d'articles scientifiques fondés sur des distributions de chaînes de caractères

Résumé

Nous présentons ici une expérimentation dans le cadre de la seconde tâche du défi fouille de textes (DEFT) 2011: appariement de résumés et d'articles scientifiques en français. Nous avons fondé nos travaux sur une approche à base de distribution de chaînes de caractères de manière à construire un système simple et correspondant à une conception endogène et multilingue des systèmes. Notre méthode a obtenu de très bons résultats pour la piste 1 "articles complets" (100%) mais a été moins efficace sur la piste 2 "articles sans introduction ni conclusion" (96%). --------------- We present here our work on the second task of 2011's Deft: pairing scientific articles and their abstract. Our approach is based on distribution of character strings. Our aim was not only to be efficient on that particular task on French but to build a system that can easily be used for other languages. Our method achieved very good results on track 1 "full articles" (100%) but had more problems with track 2 where introduction and conclusion were removed (96%).
Fichier principal
Vignette du fichier
ACTN-LEJEUNE-2011-1.pdf (5.26 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01070769 , version 1 (07-10-2014)

Identifiants

  • HAL Id : hal-01070769 , version 1

Citer

Gaël Lejeune, Romain Brixtel, Emmanuel Giguet. Deft 2011: appariements de résumés et d'articles scientifiques fondés sur des distributions de chaînes de caractères. TALN 2011, Jun 2011, Montpellier, France. pp.53-64. ⟨hal-01070769⟩
186 Consultations
162 Téléchargements

Partager

Gmail Facebook X LinkedIn More