Four billion years: the story of an ancient protein family - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 2023

Four billion years: the story of an ancient protein family

Résumé

The comparison of protein sequences has been for long a very effective tool in producing biological knowledge. It was initially based on the alignment of sequences, that is to say organizing the set of sequences in columns (of a spreadsheet) of sites which have evolved from a common site of the ancestral sequence. Alignments are generally obtained by minimizing an evolution or an edition cost. Sequence comparisons are now often performed without alignments by comparing the-mer compositions of the sequences. We present here the most popular methods used by biologists to compare sequences and place emphasis on an approach to augment the alphabet of a set of sequences in order to ease their comparison. The family of DNA topoisomerases, a set of ancient proteins whose history can be traced back 4 billion years, is used to illustrate this approach.
La comparaison de séquences protéiques a longtemps été un outil très efficace pour produire des connaissances biologiques. Elle reposait initialement sur l'alignement de séquences, c'est-à-dire l'organisation de l'ensemble des séquences en colonnes (d'un tableur) de sites qui ont évolué à partir d'un site commun de la séquence ancestrale. Les alignements sont généralement obtenus en minimisant une évolution ou un coût d'édition. Les comparaisons de séquences sont maintenant souvent effectuées sans alignements en comparant les compositions de mer des séquences. Nous présentons ici les méthodes les plus utilisées par les biologistes pour comparer des séquences et mettons l'accent sur une approche pour augmenter l'alphabet d'un ensemble de séquences afin de faciliter leur comparaison. La famille des ADN topoisomérases, un ensemble de protéines anciennes dont l'histoire remonte à 4 milliards d'années, est utilisée pour illustrer cette approche.
Fichier principal
Vignette du fichier
alex_didier.pdf (5.22 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03264942 , version 1 (18-06-2021)

Identifiants

Citer

Gilles Didier, Claudine Landès, Alain Hénaut, Bruno Torrésani. Four billion years: the story of an ancient protein family. Flandrin, P.; Jaffard, S.; Paul, T.; Torresani, B. Theoretical Physics, Wavelets, Analysis, Genomics, Springer International Publishing, pp.595-616, 2023, Applied and Numerical Harmonic Analysis, ⟨10.1007/978-3-030-45847-8_25⟩. ⟨hal-03264942⟩
87 Consultations
38 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More