Classication en présence d'outliers (données aberrantes) avec RMixmod (package de classication par modèles de mélanges) - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Classication en présence d'outliers (données aberrantes) avec RMixmod (package de classication par modèles de mélanges)

Résumé

Les modèles de mélanges offrent un cadre probabiliste flexible et efficace pour traiter des problématiques de classification supervisée ou non supervisée. L'objectif du projet MIXMOD est de diffuser un ensemble logiciel de classification des données par modèles de mélanges à un large spectre d'utilisateurs via plusieurs composants logiciels. La bibliothèque de calcul mixmodLib (C++) en est la pierre angulaire, résultat d'un travail de 15 ans sur la robustesse et la rapidité de calcul. Le package RMixmod, ensemble de fonctions pour R, interfacé avec mixmodLib (grâce à RCPP) est devenu un outil de référence pour la classidication des données. Intégrant de nombreuses fonctionnalités (algorithmes de type EM, critères de sélection, modèles parcimonieux, stratégies d'initialisation, ...), cet ensemble logiciel permet de traiter des données quantitatives, qualitatives et mixtes, y compris dans des situations complexes. Lorsque le jeu de données contient des individus parasites (c'est-à-dire ayant des valeurs aberrantes, encore appelés outliers) la classification devient alors particulièrement difficile (trouver le bon nombre de classes, affecter le bon label aux vrais individus, ...). Comment traiter un jeu de données avec des outliers ? En présence d'outliers, il peut être tentant d'appliquer un pré-traitement pour nettoyer le jeu de données avant de le soumettre à un logiciel de classification. Mais ces méthodes sont généralement peu ecaces. A l'opposé, on peut considérer que la classification doit s'effectuer sur l'ensemble des individus avec une classe supplémentaire (celle des outliers).
Fichier principal
Vignette du fichier
classification_avec_outliers_Rmixmod.pdf (857.29 Ko) Télécharger le fichier
F_Langrognet_2016_classification_et_outliers_RMixmod.pdf (4.39 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Commentaire : Résumé
Origine : Fichiers produits par l'(les) auteur(s)
Commentaire : Présentation

Dates et versions

hal-01355389 , version 1 (23-08-2016)

Licence

Paternité - Pas d'utilisation commerciale - Pas de modification

Identifiants

  • HAL Id : hal-01355389 , version 1

Citer

Florent Langrognet. Classication en présence d'outliers (données aberrantes) avec RMixmod (package de classication par modèles de mélanges). Rencontres R 2016, Juin 2016, , Jun 2016, Toulouse, France. ⟨hal-01355389⟩
85 Consultations
145 Téléchargements

Partager

Gmail Facebook X LinkedIn More