MDI (Multilevel Data Integration): Intégration de données hétérogènes incluant des données «omiques» - Archive ouverte HAL Accéder directement au contenu
Poster De Conférence Année : 2016

MDI (Multilevel Data Integration): Intégration de données hétérogènes incluant des données «omiques»

Résumé

L’intégration de données haut-débit constitue un verrou scientifique dans le domaine de la post-génomique. Certaines méthodes statistiques permettant d’expliquer un ensemble de variables par un autre ensemble de variables de nombre très supérieur au nombre d’observations ont commencé à être développées (sPLS, rCCA, rGCCA, …). La documentation de ces méthodes reste cependant partielle et les applications sont encore rares. Dans un premier temps, nous avons comparé deux méthodes différentes de régression sparse PLS sur les données issues d’une étude de nutrigénomique de la glande mammaire de chèvres en lactation (Ollier et al., 2007). Nous avons essayé d’expliquer l’expression des ARN messagers différentiels selon l’alimentation par l’abondance des microARN différentiellement exprimés (Mobuchon et al 2015) chez les mêmes animaux tout en réduisant le nombre de variables du modèle. La méthode développée par Lê Cao & al 2008 permet de sélectionner les ARN messagers (Y) comme les microARN (X). La méthode développée par Chun & al 2010 ne permet de sélectionner que les microARN. Dans les 2 cas, des sélections préalables des variables ont été nécessaires pour identifier un bon modèle prédictif. A partir de la même sélection des ARN messagers à prédire (Y), les 2 méthodes ne fournissent pas le même nombre de miARN prédicteurs optimal, même suivant un critère a priori commun, le Mean Squared Error Prediction . Néanmoins, les résultats obtenus étaient, pour partie, attendus sur le plan biologique, confortant ainsi nos modèles. Dans un second temps, nous avons initié la mise en oeuvre d’une méthode de régression fonctionnelle adaptée à nos données (Preda & al 2011). Les méthodes fonctionnelles, si elles s’avèrent pertinentes pour des variables non ordonnées telles que les données "omiques", pourraient en effet peut-être mieux gérer : i) le fort déséquilibre entre le nombre d’observations et le nombre de variables inhérent aux données haut-débit, ii) les aspects cinétiques le cas échéant. Ce travail a fait l’objet d’un sujet de stage M2 (Imbert A., 2015) dont le financement a été assuré par le crédit incitatif.
Fichier non déposé

Dates et versions

hal-01533873 , version 1 (06-06-2017)

Identifiants

  • HAL Id : hal-01533873 , version 1
  • PRODINRA : 351505

Citer

Alyssa Imbert, Anne de La Foye, Christèle Robert-Granié, Anne-Françoise Yao-Lafourcade, Isabelle Hue, et al.. MDI (Multilevel Data Integration): Intégration de données hétérogènes incluant des données «omiques». Journées d’Animation des Crédits Incitatifs du Département de Physiologie Animale et Systèmes d’Elevage (JACI Phase 2016), Apr 2016, Tours, France. , 115 p., 2016, Crédits Incitatifs financés entre 2011 et 2014. ⟨hal-01533873⟩
161 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More