An Efficient Algorithm to Discover Intra-Periodic Frequent Sequences - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

An Efficient Algorithm to Discover Intra-Periodic Frequent Sequences

Résumé

Sequential pattern mining techniques permit to discover recurring structures or patterns from very large datasets, with a very large field of applications. It aims at extracting a set of attributes, shared across time among a large number of objects in a given database. It is a challenging problem since mining algorithms are well known to be both time and memory consuming for large databases. In this paper, we extend the traditional problem of mining frequent sequences with intra-periodicity constraints. Then, we study issues related to intra-periodicity constraints such as search space pruning and partitioning. This study leads to a new efficient algorithm called Intra-Periodic Frequent Sequence Miner (IPFSM). Experimental results confirm the efficiency of IPFSM.
Les techniques de recherche des motifs séquentiels permettent de découvrir des structures ou modèles récurrents à partir de très grandes bases de données, avec un très large champ d'applications. Elles visent à extraire un ensemble d'attributs, partagés dans le temps entre un grand nombre d'objets dans une base de données. C'est un problème difficile, car les algorithmes de recherche des motifs séquentiels sont gourmandes en temps CPU et en mémoire sur des grandes bases de données. Dans ce papier, nous étendons le problème traditionnel de l'extraction des séquences fréquentes avec des contraintes d'intra-périodicité. Ensuite, nous étudions les problèmes liés aux contraintes de périodicité, notament l'élagage et le partitionnement de l'espace de recherche. Cette étude conduit à un nouvel algorithme efficace appelé Intra-Periodic Frequent Sequence Miner (IPFSM). Les résultats expérimentaux confirment l'éfficacité de l'IPFSM.
Fichier principal
Vignette du fichier
CARI2020-18.pdf (805.89 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02932844 , version 1 (08-09-2020)

Identifiants

  • HAL Id : hal-02932844 , version 1

Citer

Edith Belise Kenmogne, Clementin Tayou Djamegni. An Efficient Algorithm to Discover Intra-Periodic Frequent Sequences. CARI 2020 - Colloque Africain sur la Recherche en Informatique et en Mathématiques Apliquées, Oct 2020, Thiès, Senegal. ⟨hal-02932844⟩

Collections

AFRIQ CARI2020
29 Consultations
18 Téléchargements

Partager

Gmail Facebook X LinkedIn More