Résumé : La découverte de sous-groupes dans des données étiquetées consiste à calculer des motifs dans un espace de description des objets pour faire émerger des ensembles d'objets qui ont une répartition particulière du point de vue des étiquettes, par exemple la surreprésentation d'une valeur. Découvrir des sous-groupes intéressants dans des données purement numériques-attributs et éti-quette cible-a été peu traité. Généralement, on exploite des discrétisations qui engendrent une perte d'information et des résultats sous-optimaux. Nous trai-tons le problème du calcul d'un sous-groupe optimal au regard d'une mesure de qualité dans des données purement numériques. Nous exploitons des concepts de fermetures sur des motifs d'intervalles et des techniques d'élagage sophisti-quées. Nous validons empiriquement la pertinence de notre algorithme et décri-vons succinctement un cas d'application à l'optimisation de la pousse de végé-taux en environnement contrôlé.
https://hal.archives-ouvertes.fr/hal-02483329 Contributor : Alexandre MillotConnect in order to contact the contributor Submitted on : Tuesday, February 18, 2020 - 3:42:57 PM Last modification on : Thursday, September 9, 2021 - 1:06:01 PM
Alexandre Millot, Rémy Cazabet, Jean-François Boulicaut. Découverte d'un sous-groupe optimal dans des données purement numériques. Extraction et Gestion des Connaissances (EGC), Jan 2020, Bruxelles, Belgique. pp.25-36. ⟨hal-02483329⟩