Fouille de données pour associer des noms de sessions aux articles scientifiques - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Fouille de données pour associer des noms de sessions aux articles scientifiques

Solen Quiniou
Peggy Cellier
Thierry Charnois

Résumé

In this paper, we present a proposition based on data mining to tackle the DEFT 2014 challenge. We focus on task 4 which consists of identifying the right conference session for scientific papers. The proposed approach is based on a combination of two data mining techniques. Sequence mining extracts frequent phrases in scientific papers in order to build paper and session descriptions. Then, those descriptions of papers and sessions are used to create a graph which represents shared descriptions. A graph mining technique is applied on the graph in order to extract a collection of homogenous sub-graphs corresponding to sets of papers associated to sessions.
Nous décrivons dans cet article notre participation à l'édition 2014 de DEFT. Nous nous intéressons à la tâche consistant à associer des noms de session aux articles d'une conférence. Pour ce faire, nous proposons une approche originale, symbolique et non supervisée, de découverte de connaissances. L'approche combine des méthodes de fouille de données séquentielles et de fouille de graphes. La fouille de séquences permet d'extraire des motifs fréquents dans le but de construire des descriptions des articles et des sessions. Ces descriptions sont ensuite représentées par un graphe. Une technique de fouille de graphes appliquée sur ce graphe permet d'obtenir des collections de sous-graphes homogènes, correspondant à des collections d'articles et de noms de sessions.
Fichier principal
Vignette du fichier
deft2014_06_lina.pdf (371.08 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01113464 , version 1 (05-02-2015)

Identifiants

  • HAL Id : hal-01113464 , version 1

Citer

Solen Quiniou, Peggy Cellier, Thierry Charnois. Fouille de données pour associer des noms de sessions aux articles scientifiques. DEFT 2014, Jul 2014, Marseille, France. ⟨hal-01113464⟩
381 Consultations
123 Téléchargements

Partager

Gmail Facebook X LinkedIn More