Skip to Main content Skip to Navigation
Conference papers

Indexer, comparer, apparier des textes et leurs résumés : une exploration.

Résumé : Nous présentons ici la démarche qui nous a valu un score de 100% de réussite au défi DEFT 2011, et la première place ex-æquo, dans la tâche d'appariement de résumés avec des articles dépourvus d'introduction et de conclusion : nous avons testé plusieurs types d'indexation et de distance résumé-texte, et mis au point une méthode d'appariement, en univers fermé, robuste et sans nécessité d'information extérieure. En combinant quatre variantes de la distance de compression, indépendante de la langue et du type de codage, elle permet d'atteindre 93% ; les 100% sont atteints avec la distance de Hellinger appliquée à des textes indexés par des noms lemmatisés et des termes composés, distance qui surpasse ici la classique TF-IDF. Nous suggérons son application en univers ouvert, avec plus de textes que de résumés, et des résumés sans texte.
Complete list of metadata

Cited literature [4 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-00630405
Contributor : Alain Lelu <>
Submitted on : Monday, October 10, 2011 - 9:41:41 PM
Last modification on : Friday, April 2, 2021 - 3:35:35 AM
Long-term archiving on: : Wednesday, January 11, 2012 - 2:21:23 AM

File

Cadot_Aubin_Lelu_DEFT2011c.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00630405, version 1

Collections

Citation

Martine Cadot, Sylvain Aubin, Alain Lelu. Indexer, comparer, apparier des textes et leurs résumés : une exploration.. TALN 2011, Atelier DEFT, Jun 2011, Montpellier, France. p. 85-95. ⟨hal-00630405⟩

Share

Metrics

Record views

477

Files downloads

306