Un cadre formel pour l'étude des mesures d'intérêt des règles d'association - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Un cadre formel pour l'étude des mesures d'intérêt des règles d'association

Résumé

Depuis la définition du problème de l'extraction des règles d'association et la proposition de l'algorithme Apriori, beaucoup de travaux se sont focalisés sur l'extraction et l'évaluation des règles à partir de mesures objectives. Ces dernières sont essentiellement utilisées pour filtrer les règles extraites. Ces travaux ont donné lieu à quelques améliorations algorithmiques, un nombre important d'améliorations techniques et de très nombreuses nouvelles mesures. Cependant, peu d'entre eux se sont attaché à mêler extraction et évaluation. Nous introduisons ici un cadre formel d'étude des règles d'association et des mesures d'intérêt qui permet une étude analytique des ces objets. Ce cadre s'appuie sur la notion de table de contingence d'une règle et via la modélisation par une fonction de trois variable des mesures d'intérêt, permet une étude mathématique des mesures et de leurs propriétés algorithmiques. Nous détaillons le cas de trois de ces propriétés : la all-confidence, la Universal Existential Upward Closure, et la propriété d'élagage pour les règles optimales. Chacune des ces propriétés est dans un premier temps généralisée, puis nous proposons à partir du cadre formel des conditions d'existence nécessaire, suffisante, ou nécessaire et suffisante. Ces conditions sont alors appliquées à 42 mesures et permettent pour chaque mesure de proposer un ensemble de propriétés algorithmiques (et les algorithmes sous-jacents) qu'elles vérifient. L'impact de ces propriétés sera illustré à partir d'expérimentations sur différents jeux de données.
Fichier principal
Vignette du fichier
le-bras-etal_GDRI3_2011.pdf (38.8 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00632775 , version 1 (15-10-2011)

Identifiants

  • HAL Id : hal-00632775 , version 1

Citer

Yannick Le Bras, Philippe Lenca, Stéphane Lallich. Un cadre formel pour l'étude des mesures d'intérêt des règles d'association. Journée d'animation du GRD I3 sur la  fouille de données, Sep 2011, Lyon, France. ⟨hal-00632775⟩
243 Consultations
97 Téléchargements

Partager

Gmail Facebook X LinkedIn More