Skip to Main content Skip to Navigation
Conference papers

Détection de mots-clés par approches au grain caractère et au grain mot

Résumé : Nous présentons dans cet article les méthodes utilisées par l'équipe HULTECH pour sa participation au Défi Fouille de Textes 2012 (Deft 2012). La tâche de cette édition du défi consiste à retrouver dans des articles scientifiques, les mots-clés choisis par les auteurs. Nous nous appuyons sur la détection de chaînes répétées maximales (rst rmax ), au grain caractère et au grain mot. La méthode développée est simple et non supervisée. Elle a permis à notre système d'atteindre la 3e place (sur 10 équipes) sur la première piste du défi. ----------- We present here the HULTECH(Human Language Technology) team approach for the Deft 2012 (french text mining challenge). The aim of the challenge is to retrieve the keywords given by the authors of scientific articles. Our method relies on a text algorithmics technic : detection of maximal repeated strings. This technic is applied at character level and word level. We achieved the third rank (over 10) of the first track.
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-01073775
Contributor : Greyc Référent Connect in order to contact the contributor
Submitted on : Wednesday, October 22, 2014 - 9:35:12 AM
Last modification on : Tuesday, October 19, 2021 - 11:34:56 PM
Long-term archiving on: : Friday, January 23, 2015 - 10:06:10 AM

File

ACTN-DOUALAN-2012-1.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01073775, version 1

Citation

Gaëlle Doualan, Mathieu Boucher, Romain Brixtel, Gaël Lejeune, Gaël Dias. Détection de mots-clés par approches au grain caractère et au grain mot. TALN 2012, Jun 2012, Grenoble, France. pp.41-48. ⟨hal-01073775⟩

Share

Metrics

Les métriques sont temporairement indisponibles