Détection de mots-clés par approches au grain caractère et au grain mot - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Détection de mots-clés par approches au grain caractère et au grain mot

Résumé

Nous présentons dans cet article les méthodes utilisées par l'équipe HULTECH pour sa participation au Défi Fouille de Textes 2012 (Deft 2012). La tâche de cette édition du défi consiste à retrouver dans des articles scientifiques, les mots-clés choisis par les auteurs. Nous nous appuyons sur la détection de chaînes répétées maximales (rst rmax ), au grain caractère et au grain mot. La méthode développée est simple et non supervisée. Elle a permis à notre système d'atteindre la 3e place (sur 10 équipes) sur la première piste du défi. ----------- We present here the HULTECH(Human Language Technology) team approach for the Deft 2012 (french text mining challenge). The aim of the challenge is to retrieve the keywords given by the authors of scientific articles. Our method relies on a text algorithmics technic : detection of maximal repeated strings. This technic is applied at character level and word level. We achieved the third rank (over 10) of the first track.
Fichier principal
Vignette du fichier
ACTN-DOUALAN-2012-1.pdf (1.79 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01073775 , version 1 (22-10-2014)

Identifiants

  • HAL Id : hal-01073775 , version 1

Citer

Gaëlle Doualan, Mathieu Boucher, Romain Brixtel, Gaël Lejeune, Gaël Dias. Détection de mots-clés par approches au grain caractère et au grain mot. TALN 2012, Jun 2012, Grenoble, France. pp.41-48. ⟨hal-01073775⟩
99 Consultations
35 Téléchargements

Partager

Gmail Facebook X LinkedIn More