Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données

Résumé : Pour un ordre partiel (P, ⪯) et un prédicat monotone Q sur P, la dualisation consiste à identifier tous les éléments maximaux de P vérifiant Q à partir de tous éléments minimaux de P ne vérifiant pas Q, et vice versa. La dualisation est équivalente à l’énumération des transversaux minimaux des hypergraphes lorsque (P, ⪯) est un treillis booléen. Dans le cadre de la découverte de motifs intéressants dans les bases de données, P représente un ensemble fini de motifs et quand P est isomorphe à un treillis booléen, le problème d’extraction de motifs est dit représentable par des ensembles. La classe de ces problèmes est notée RAS. Dans cet article, nous introduisons une classe beaucoup plus grande que RAS, notée WRAS, qui introduit une représentation faible par les ensembles pour les problèmes d’extraction de motifs intéressants. Nous identifions une sous-classe efficace de WRAS, notée EWRAS, pour laquelle le problème de dualisation reste quasi-polynomial. Enfin, nous montrons que l’un des problèmes connus pour ne pas appartenir à RAS, à savoir les séquences fréquentes rigides avec joker, appartient à EWRAS. Ces nouvelles classes devraient avoir un impact important pour la clarification des approches de découverte de motifs intéressants dans les bases de données.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01353186
Contributor : Équipe Gestionnaire Des Publications Si Liris <>
Submitted on : Wednesday, August 10, 2016 - 4:25:57 PM
Last modification on : Tuesday, February 26, 2019 - 4:07:30 PM

Identifiers

  • HAL Id : hal-01353186, version 1

Citation

Lhouari Nourine, Jean-Marc Petit. Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données. BDA 2012, Oct 2012, Clermont-Ferrand, France. pp.1-20. ⟨hal-01353186⟩

Share

Metrics

Record views

242