Les avantages de la discrétisation floue dans l'apprentissage de règles
Résumé
Le traitement des données numériques est un problème difficile pour les techniques d'apprentissage basées sur la logique. La solution la plus communément employée est la discrétisation. Cependant, du fait de la transition abrupte entre les classes définies lors de la discrétisation, les degrés de support et de confiance peuvent manquer de robustesse et de représentativité par rapport aux données (en particulier quand la règle a beaucoup d'exemples dont les valeurs sont à la limite des ensembles utilisés pour la discrétisation). Cet article décrit une étude formelle de la sensibilité des degrés de confiance et de support des règles par rapport à de petites variations des limites des ensembles utilisés pour la discrétisation, ou des valeurs des données numériques. Les ensembles flous étant connus pour permettre une transition graduelle entre les classes, les contreparties floues de ces mesures sont introduites et leurs propriétés mathématiques sont établies. La comparaison de l'efficacité des différentes techniques est faite sur différentes bases de données de référence de manière à établir clairement l'intérêt de l'induction de règles floues.