Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données

Résumé

Pour un ordre partiel (P, ⪯) et un prédicat monotone Q sur P, la dualisation consiste à identifier tous les éléments maximaux de P vérifiant Q à partir de tous éléments minimaux de P ne vérifiant pas Q, et vice versa. La dualisation est équivalente à l’énumération des transversaux minimaux des hypergraphes lorsque (P, ⪯) est un treillis booléen. Dans le cadre de la découverte de motifs intéressants dans les bases de données, P représente un ensemble fini de motifs et quand P est isomorphe à un treillis booléen, le problème d’extraction de motifs est dit représentable par des ensembles. La classe de ces problèmes est notée RAS. Dans cet article, nous introduisons une classe beaucoup plus grande que RAS, notée WRAS, qui introduit une représentation faible par les ensembles pour les problèmes d’extraction de motifs intéressants. Nous identifions une sous-classe efficace de WRAS, notée EWRAS, pour laquelle le problème de dualisation reste quasi-polynomial. Enfin, nous montrons que l’un des problèmes connus pour ne pas appartenir à RAS, à savoir les séquences fréquentes rigides avec joker, appartient à EWRAS. Ces nouvelles classes devraient avoir un impact important pour la clarification des approches de découverte de motifs intéressants dans les bases de données.
Fichier non déposé

Dates et versions

hal-01353186 , version 1 (10-08-2016)

Identifiants

  • HAL Id : hal-01353186 , version 1

Citer

Lhouari Nourine, Jean-Marc Petit. Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données. BDA 2012, Oct 2012, Clermont-Ferrand, France. pp.1-20. ⟨hal-01353186⟩
145 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More