Thématique Biologie des systèmes et réseaux biologiques

Les connaissances biologiques augmentent à une vitesse sans précédent, et font souvent
référence à un aspect particulier du mécanisme de la vie. La biologie des systèmes (ou biologie
systémique) vise à intégrer les connaissances biologiques provenant de sources hétérogènes,
dans le but de comprendre le réseau d’interactions très complexe entre les molécules. L’outil
indispensable pour atteindre ce but est la construction de modèles capables de capter les
caractéristiques et de simuler le fonctionnement simultané de plusieurs systèmes identifiés (mais
non-indépendants) d’un organisme vivant.
Notre travail porte actuellement sur deux types de modèles :
Les systèmes dynamiques
Un système biologique est souvent décrit par un réseau d’interactions. On parle ainsi de réseau de
régulation de gènes, de réseau d’interaction protéines-protéines, de réseau métabolique etc.
Vu comme un graphe, chacun de ces réseaux représente une vue statique d’un aspect de la vie
cellulaire, indiquant quels sont les acteurs et comment ils interagissent deux à deux. Pour que le
mécanisme des interactions puisse être compris, ces réseaux doivent être vus dans un contexte
dynamique, où des informations qualitatives, quantitatives et temporelles sont représentées
simultanément et participent simultanément à la dynamique du système. Nous sommes à l’étude
d’une approche originale des systèmes dynamiques (et plus particulièrement du réseau de
régulation de gènes) à l’aide d’un modèle combinant une approche probabiliste et une approche par
contraintes mixtes.
Les graphes d’interactions pondérés
Les expériences biologiques permettent d’appréhender deux caractéristiques particulières des
systèmes vivants : (i) le génotype ou la distribution des gènes dans un génome et (ii) le phénotype
ou les caractéristiques fonctionnelles du vivant. Il existe différents travaux qui permettent de
calculer la distance entre 2 gènes en se basant sur l’ordre dans lequel sont disposés les gènes
dans un génome. Cette distance représente une abstraction de la caractéristique (i). Par ailleurs,
il existe diverses descriptions des chemins que parcourt un signal biologique dans un graphe
orienté qu’est le réseau d’interactions macromoléculaires. La distance parcourue par le signal pour
aller d’un gène vers un autre est alors une abstraction de la caractéristique (ii). Bien qu’issues
d’expériences de nature différentes, les deux abstractions concernent le même système vivant
que l’on veut mieux comprendre. Comparer les deux distances, à savoir génotype et phénotype,
est l’un de nos défis.

Thématique Génomique Comparative

Les génomes d’un grand nombre d’espèces sont désormais entièrement séquencés, et, la
technologie aidant, le phénomène s’accélère de façon soutenue. Etre capable de comparer
efficacement deux ou plusieurs génomes est donc la clé (entre autres) de la compréhension de la
proximité entre les espèces (en définissant des distances inter-espèces), de l’identification
de fonctionnalités ou de pathologies par similarité locale ou globale, de l’interprétation des
réarrangements génomiques etc.
Mesures de (dis)similarité entre Génomes
On cherche ici à comparer des génomes entre eux, et notamment à les comparer deux à deux. Dans
ce cas, il faut déterminer une mesure (i.e., un nombre) qui permet d’évaluer, à travers leurs
génomes, la proximité (ou non) des deux espèces étudiées. Ces mesures doivent pouvoir capturer
le fait qu’au cours de l’évolution biologique, des échanges, des inversions, des apparitions ou des
disparitions de fragments existent le long du génome ; autant de phénomènes qui entraînent donc
une modification du nombre et de l’ordre des gènes dans un génome.
Deux grandes problématiques émergent à l’heure actuelle :
  • Proposer des modèles de mesure, qui soient les plus pertinents et représentatifs
    possibles (notamment, des modèles autorisant insertions et suppressions, qui prennent en
    compte les duplications de gènes dans les génomes, ou encore qui permettent de comparer des
    génomes multichromosomiques)
  • Proposer des méthodes de calcul de ces mesures, puisque, pour toutes les
    mesures ’’classiques’’ existantes (breakpoints, inversions, etc.), le calcul de la mesure devient
    algorithmiquement difficile, en particulier dès que des duplications de gènes apparaissent.

Thématique Identification de protéines par MS/MS

La spectrométrie de masse en tandem est une technique qui permet l’identification d’une protéine
par découpage successif de la protéine en peptides et puis des peptides en fragments, dont les
masses sont représentées graphiquement forme de spectres. En interprétant le spectre de
chaque peptide on déduit la suite d’acides aminés formant le peptide, et en recherchant les
peptides identifiés dans une banque de protéines on identifie la protéine recherchée.
Cette démarche se heurte à beaucoup de difficultés qui sont à la fois d’ordre biologique et
informatique, même pour une protéine connue (présente dans les banques). D’autant plus, lorsque
la protéine n’est pas connue et, de surcroît, lorsqu’on ne cherche pas à identifier une protéine mais
toutes les protéines d’un complexe, la démarche n’est plus valable et a besoin d’une alternative.
C’est à cette alternative que nous nous intéressons.