Assemblage de novo avec Spark

Ronan Bocquillon; Stéphane Gazut; Lorène Allano

Communication Dans Un Congrès Année : 2018

Assemblage de novo avec Spark

(1, 2) , (1) , (1)

1
2

Ronan Bocquillon

Fonction : Auteur
PersonId : 1025429

Laboratoire d'analyse des données et d'intelligence des systèmes (CEA, LIST)

Laboratoire d'Informatique Fondamentale et Appliquée de Tours

Stéphane Gazut

Fonction : Auteur
PersonId : 928101
IdHAL : stephane-gazut
ORCID : 0000-0002-4796-3117

Laboratoire d'analyse des données et d'intelligence des systèmes (CEA, LIST)

Lorène Allano

Fonction : Auteur

Laboratoire d'analyse des données et d'intelligence des systèmes (CEA, LIST)

Résumé

Les récentes avancées en biologie moléculaire et l’avènement des méthodes de séquençage à haut débit ont rendu possible la lecture, l’analyse et la réutilisation d’une très grande partie de l’information présente dans le génome. Malheureusement, notre capacité à analyser l’immense masse de données générée par ces nouvelles technologies de séquençage est aujourd’hui limitée par nos moyens de calcul. Dans ces travaux, nous nous intéressons plus particulièrement aux problématiques de l’assemblage de novo, dont l’objectif est de reconstruire une séquence ADN à partir d’un ensemble de fragments issus de cette même séquence. Nous mettons en évidence les avantages d’utiliser les outils (notamment méthodologiques) de la communauté “big data” pour résoudre ce problème sur des instances réelles de très grande taille. Nous discutons des résultats numériques prometteurs que nous avons pu obtenir en implémentant cette approche à l’aide du framework Apache Spark.

Mots clés

statistical analysis data processing bioinformatics, DNA sequencing, big data

bioinformatique Données massives Graphes Algorithmes distribués Spark Hadoop Génomique Séquençage Haut-Débit

Domaines

Génomique, Transcriptomique et Protéomique [q-bio.GN] Bio-informatique [q-bio.QM] Calcul parallèle, distribué et partagé [cs.DC]

Fichier principal

roadef.pdf (258.5 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Ronan Bocquillon : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01705173

Soumis le : vendredi 9 février 2018-10:41:14

Dernière modification le : mercredi 3 avril 2024-11:14:12

Archivage à long terme le : jeudi 10 mai 2018-12:24:40

Dates et versions

hal-01705173 , version 1 (09-02-2018)

Identifiants

HAL Id : hal-01705173 , version 1

Citer

Ronan Bocquillon, Stéphane Gazut, Lorène Allano. Assemblage de novo avec Spark. ROADEF 2018, 19ème congrès annuel de la société Française de Recherche Opérationnelle et d’Aide à la Décision, Feb 2018, Lorient, France. ⟨hal-01705173⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CEA UNIV-TOURS CNRS DRT CEA-UPSAY ROOT-TOURS UNIV-PARIS-SACLAY LIST LIFAT INSA-GROUPE DM2I INSA-CVL GS-ENGINEERING GS-COMPUTER-SCIENCE GS-SPORT-HUMAN-MOVEMENT DIN

151 Consultations

156 Téléchargements

Assemblage de novo avec Spark

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager