An Efficient Algorithm to Discover Intra-Periodic Frequent Sequences
Résumé
Sequential pattern mining techniques permit to discover recurring structures or patterns from very large datasets, with a very large field of applications. It aims at extracting a set of attributes, shared across time among a large number of objects in a given database. It is a challenging problem since mining algorithms are well known to be both time and memory consuming for large databases. In this paper, we extend the traditional problem of mining frequent sequences with intra-periodicity constraints. Then, we study issues related to intra-periodicity constraints such as search space pruning and partitioning. This study leads to a new efficient algorithm called Intra-Periodic Frequent Sequence Miner (IPFSM). Experimental results confirm the efficiency of IPFSM.
Les techniques de recherche des motifs séquentiels permettent de découvrir des structures ou modèles récurrents à partir de très grandes bases de données, avec un très large champ d'applications. Elles visent à extraire un ensemble d'attributs, partagés dans le temps entre un grand nombre d'objets dans une base de données. C'est un problème difficile, car les algorithmes de recherche des motifs séquentiels sont gourmandes en temps CPU et en mémoire sur des grandes bases de données. Dans ce papier, nous étendons le problème traditionnel de l'extraction des séquences fréquentes avec des contraintes d'intra-périodicité. Ensuite, nous étudions les problèmes liés aux contraintes de périodicité, notament l'élagage et le partitionnement de l'espace de recherche. Cette étude conduit à un nouvel algorithme efficace appelé Intra-Periodic Frequent Sequence Miner (IPFSM). Les résultats expérimentaux confirment l'éfficacité de l'IPFSM.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...