Extraction de motifs séquentiels sous contraintes multiples (poster)

Nicolas Béchet 1 Peggy Cellier 2 Thierry Charnois 3, 1 Bruno Crémilleux 1
1 Equipe CODAG - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
2 LIS - Logical Information Systems
IRISA-D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE
Résumé : Introduite par Srikant et Agrawal (1996), la fouille de données séquentielles permet de découvrir des corrélations entre des événements selon une relation d'ordre (e.g. le temps). Deux défis majeurs du domaine sont d'une part la définition de méthodes et d'outils permettant d'appréhender de très grands volumes de données et d'autre part la sélection de motifs potentiellement intéressants. En intégrant des connaissances sous forme d'apriori dans le processus de fouille, l'extraction de motifs sous contraintes (Ng et al. (1998)) apporte des éléments de solution aux défis précédents. En effet, elle contribue à réduire le nombre de motifs en éliminant les motifs a priori inintéressants. Ensuite, elle permet souvent de concevoir des algorithmes plus efficaces en réduisant l'espace de recherche. Pei et al. (2007) ont effectué une étude et proposé un cadre formalisé pour l'extraction de motifs séquentiels sous contraintes. Cependant, cette étude ne prend pas en compte la notion de contrainte multiple, une telle contrainte étant définie comme une combinaison de plusieurs contraintes possédant des propriétés antinomiques. Un exemple de contrainte multiple est la contrainte combinant la contrainte de support (qui est anti-monotone), celle d'appartenance d'un item (qui est monotone) et celle de gap entre éléments de la séquence. À notre connaissance, il n'existe pas dans la littérature d'algorithme d'extraction des motifs sous contraintes multiples avec des séquences composées d'itemsets. L'objet de cet article est de traiter ce problème délicat en proposant l'algorithme PrefixConstraint.
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01024331
Contributor : Greyc Référent <>
Submitted on : Wednesday, July 16, 2014 - 9:17:31 AM
Last modification on : Tuesday, November 19, 2019 - 9:58:34 AM
Long-term archiving on: Monday, November 24, 2014 - 2:56:26 PM

File

ACTN-BECHET-2013-1.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01024331, version 1

Citation

Nicolas Béchet, Peggy Cellier, Thierry Charnois, Bruno Crémilleux. Extraction de motifs séquentiels sous contraintes multiples (poster). 13ème Journées Francophones Extraction et Gestion de Connaissances (EGC 2013), Jan 2013, toulouse, France. 2 p. ⟨hal-01024331⟩

Share

Metrics

Record views

729

Files downloads

402