Classication en présence d'outliers (données aberrantes) avec RMixmod (package de classication par modèles de mélanges)
Résumé
Les modèles de mélanges offrent un cadre probabiliste flexible et efficace pour traiter des problématiques de classification supervisée ou non supervisée. L'objectif du projet MIXMOD est de diffuser un ensemble logiciel de classification des données par modèles de mélanges à un large spectre d'utilisateurs via plusieurs composants logiciels. La bibliothèque de calcul mixmodLib (C++) en est la pierre angulaire, résultat d'un travail de 15 ans sur la robustesse et la rapidité de calcul. Le package RMixmod, ensemble de fonctions pour R, interfacé avec mixmodLib (grâce à RCPP) est devenu un outil de référence pour la classidication des données. Intégrant de nombreuses fonctionnalités (algorithmes de type EM, critères de sélection, modèles parcimonieux, stratégies d'initialisation, ...), cet ensemble logiciel permet de traiter des données quantitatives, qualitatives et mixtes, y compris dans des situations complexes. Lorsque le jeu de données contient des individus parasites (c'est-à-dire ayant des valeurs aberrantes, encore appelés outliers) la classification devient alors particulièrement difficile (trouver le bon nombre de classes, affecter le bon label aux vrais individus, ...). Comment traiter un jeu de données avec des outliers ? En présence d'outliers, il peut être tentant d'appliquer un pré-traitement pour nettoyer le jeu de données avant de le soumettre à un logiciel de classification. Mais ces méthodes sont généralement peu ecaces. A l'opposé, on peut considérer que la classification doit s'effectuer sur l'ensemble des individus avec une classe supplémentaire (celle des outliers).
Fichier principal
classification_avec_outliers_Rmixmod.pdf (857.29 Ko)
Télécharger le fichier
F_Langrognet_2016_classification_et_outliers_RMixmod.pdf (4.39 Mo)
Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Commentaire : Résumé
Commentaire : Résumé
Origine : Fichiers produits par l'(les) auteur(s)
Commentaire : Présentation
Commentaire : Présentation