De l'usage des statistiques pour l’analyse de données de composition
Résumé
Les données dites de composition décrivent les parties d’un tout comme mutuellement exclusives et exhaustives (un objet de masse totale m peut ainsi être décomposé en ses différents constituants, de masses respectives m1, m2, …, mD). En rapportant les parties au tout (teneurs exprimées en pourcentages par exemple), les rapports considérés mettent en jeu des parties communes au numérateur et au dénominateur et leur somme est constante. L’univers des données de compositions (ou simplex) est alors différent de celui pour lequel ont été conçues la quasi-totalité de nos méthodes statistiques.
Depuis les premiers avertissements formulés par Pearson à la fin du XIXe siècle, d’importants développements ont été réalisés, au premier rang desquels figure la monographie de J. Aitchison. L’auteur y a notamment proposé plusieurs transformations permettant de résoudre ces problèmes de géométrie. Pour autant, ces aspects méthodologiques peinent à être pris en compte, quand ils ne sont pas simplement refusés au prix d’une argumentation parfois discutable.
L’objet du présent poster est ainsi de rappeler les fondements théoriques de l’analyse de compositions et de discuter de la pertinence de certaines approches multivariées.