Nouvelle méthode de détection de dérive basée sur la distance entre les erreurs de classification
Résumé
La classification dynamique s'intéresse au traitement des données non-stationnaires issues des environnements évolutifs dans le temps. Ces données peuvent présenter des dérives, qui affectent la performance du modèle d'apprentissage initialement construit. Aujourd'hui, beaucoup d'intérêts sont portés sur la surveillance, la mise à jour et le diagnostic de ces dérives afin d'améliorer la performance du modèle d'apprentissage. Dans ce contexte, une nouvelle méthode de détection de dérive basée sur la distance entre les erreurs de classification est présentée. Cette méthode, nommée EDIST, surveille la distribution des distances des erreurs de classification entre deux fenêtres de données afin de détecter une différence à travers un test d'hypothèse statistique. EDIST a été testée à travers des bases de données artificielles et réelles. Des résultats encourageants ont été trouvés par rapport à des méthodes similaires. EDIST a pu trouver les meilleurs taux d'erreur de classification dans la plupart des cas et a montré une robustesse envers le bruit et les fausses alarmes.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...