Novel approaches for the exploitation of high throughput sequencing data

Antoine Limasset 1
1 GenScale - Scalable, Optimized and Parallel Algorithms for Genomics
Inria Rennes – Bretagne Atlantique , IRISA_D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE
Résumé : Cette thèse a pour sujet les méthodes informatiques traitant les séquences ADN provenant des séquenceurs haut débit. Nous nous concentrons essentiellement sur la reconstruction de génomes à partir de fragments ADN (assemblage génomique) et sur des problèmes connexes. Ces tâches combinent de très grandes quantités de données et des problèmes combinatoires. Différentes structures de graphe sont utilisées pour répondre à ces prob- lèmes, présentant des compromis entre passage à l’échelle et qualité d’assemblage. Ce document introduit plusieurs contributions pour répondre à ces problèmes. De nouvelles représentations de graphes d’assemblage sont proposées pour autoriser un meilleur passage à l’échelle. Nous présentons également de nouveaux usages de ces graphes, dif- férent de l’assemblage, ainsi que des outils pour utiliser ceux-ci comme références dans les cas où un génome de référence n’est pas disponible. Pour finir nous montrons comment utiliser ces méthodes pour produire un meilleur assemblage en utilisant des ressources raisonnables.
Type de document :
Thèse
Bioinformatics [q-bio.QM]. Université Rennes 1, 2017. English
Liste complète des métadonnées

Littérature citée [159 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/tel-01566938
Contributeur : Antoine Limasset <>
Soumis le : vendredi 21 juillet 2017 - 14:28:15
Dernière modification le : jeudi 15 novembre 2018 - 11:59:01

Fichier

Identifiants

  • HAL Id : tel-01566938, version 1

Citation

Antoine Limasset. Novel approaches for the exploitation of high throughput sequencing data. Bioinformatics [q-bio.QM]. Université Rennes 1, 2017. English. 〈tel-01566938〉

Partager

Métriques

Consultations de la notice

561

Téléchargements de fichiers

397