ClustInvest : outils R pour l'analyse et l'interprétation de classifications nonsupervisées avec variables binaires - Laboratoire Jean Kuntzmann Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

ClustInvest : outils R pour l'analyse et l'interprétation de classifications nonsupervisées avec variables binaires

Gérard Grégoire
  • Fonction : Auteur
  • PersonId : 1042606
  • IdRef : 052517853
Jean-Pierre Imbert
  • Fonction : Auteur
  • PersonId : 1042605

Résumé

Nous proposons des outils rassemblés dans un package R, ClustInvest, pour faciliter l'analyse et l'interprétation des résultats d'une classification nonsupervisée dans le cas de variables binaires. Après avoir présenté les fonctionnalités du package, nous l'utilisons pour étudier les résultats de classifications effectuées sur des données d'accidents de décompression en plongée professionnelle (DCI). Dans le cas des données DCI, les variables sont des symptômes manifestés ou pas par l'accidenté (douleurs articulaires, troubles de l'équilibre, nausées, paresthésie-hypoesthésie, fatigue, douleurs dorsales, etc). Pour faciliter la lecture, nous identifions dans ce texte, les variables aux symptômes (Xj = 1 si le symptôme est présent, 0 sinon). Il est intéressant, en particulier lorsque le nombre de symptômes manifestés par un individu est plutôt modéré, de disposer de statistiques sur le nombre de symptômes par individu, de statistiques sur le nombre d'occurrences isolées d'un symptôme, le nombre d'occurrences conjointes de 2 symptômes, de 3 symptômes, etc. Il est aussi utile d'identifier les symptômes ayant tendance à apparaître conjointement. Ces informations participent à l'interprétation des groupes. Une aide importante aussi pour l'interprétation d'une classification est le fait de disposer de tableaux permettant de visualiser l'importance de tel ou tel symptôme dans la composition d'un groupe, de visualiser comment les manifestations d'un symptôme se distribuent entre les groupes. Il peut aussi être pertinent de mesurer le caractère plus ou moins discriminant d'un symptôme ou d'un couple de symptômes. Ces fonctionnalités et d'autres sont présentes dans ClustInvest.
Fichier non déposé

Dates et versions

hal-02012479 , version 1 (08-02-2019)

Identifiants

  • HAL Id : hal-02012479 , version 1

Citer

Gérard Grégoire, Jean-Pierre Imbert. ClustInvest : outils R pour l'analyse et l'interprétation de classifications nonsupervisées avec variables binaires: Application à des données d’accidents de décompression en plongée professionnelle. Quatrièmes Rencontres R, Jun 2015, Grenoble, France. ⟨hal-02012479⟩
26 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More