Extraction de motifs séquentiels sous contraintes multiples (poster)

Nicolas Béchet 1 Peggy Cellier 2 Thierry Charnois 3, 1 Bruno Crémilleux 1
1 Equipe CODAG - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
2 LIS - Logical Information Systems
IRISA-D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE
Résumé : Introduite par Srikant et Agrawal (1996), la fouille de données séquentielles permet de découvrir des corrélations entre des événements selon une relation d'ordre (e.g. le temps). Deux défis majeurs du domaine sont d'une part la définition de méthodes et d'outils permettant d'appréhender de très grands volumes de données et d'autre part la sélection de motifs potentiellement intéressants. En intégrant des connaissances sous forme d'apriori dans le processus de fouille, l'extraction de motifs sous contraintes (Ng et al. (1998)) apporte des éléments de solution aux défis précédents. En effet, elle contribue à réduire le nombre de motifs en éliminant les motifs a priori inintéressants. Ensuite, elle permet souvent de concevoir des algorithmes plus efficaces en réduisant l'espace de recherche. Pei et al. (2007) ont effectué une étude et proposé un cadre formalisé pour l'extraction de motifs séquentiels sous contraintes. Cependant, cette étude ne prend pas en compte la notion de contrainte multiple, une telle contrainte étant définie comme une combinaison de plusieurs contraintes possédant des propriétés antinomiques. Un exemple de contrainte multiple est la contrainte combinant la contrainte de support (qui est anti-monotone), celle d'appartenance d'un item (qui est monotone) et celle de gap entre éléments de la séquence. À notre connaissance, il n'existe pas dans la littérature d'algorithme d'extraction des motifs sous contraintes multiples avec des séquences composées d'itemsets. L'objet de cet article est de traiter ce problème délicat en proposant l'algorithme PrefixConstraint.
Type de document :
Communication dans un congrès
13ème Journées Francophones Extraction et Gestion de Connaissances (EGC 2013), Jan 2013, toulouse, France. 2 p., 2013
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01024331
Contributeur : Greyc Référent <>
Soumis le : mercredi 16 juillet 2014 - 09:17:31
Dernière modification le : vendredi 16 novembre 2018 - 01:40:31
Document(s) archivé(s) le : lundi 24 novembre 2014 - 14:56:26

Fichier

ACTN-BECHET-2013-1.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01024331, version 1

Citation

Nicolas Béchet, Peggy Cellier, Thierry Charnois, Bruno Crémilleux. Extraction de motifs séquentiels sous contraintes multiples (poster). 13ème Journées Francophones Extraction et Gestion de Connaissances (EGC 2013), Jan 2013, toulouse, France. 2 p., 2013. 〈hal-01024331〉

Partager

Métriques

Consultations de la notice

689

Téléchargements de fichiers

341