Recherche d'instances de motifs expressifs avec Logol. Application à la modélisation d'événements de frameshift -1 - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Expressive Pattern Matching with Logol. Application to the Modelling of -1 Ribosomal Frameshift events

Recherche d'instances de motifs expressifs avec Logol. Application à la modélisation d'événements de frameshift -1

Résumé

The current practice of pattern matching tools and the gap that may be observed with the actual modelling needs of people analysing genome structures clearly demonstrates the need for higher level languages to describe and search for these structures in genomic sequences. It appears necessary to offer new tools allowing to build more expressive models of families of biological sequences, on the basis of their content and structure. This article presents Logol, a new application designed to achieve pattern matching in possibly large sequences with realistic biological motifs. Logol consists in both a language for describing patterns, and the associated parser for effectively scanning sequences (RNA, DNA or protein) with such motifs. The language, based on an high level gramatical formalism, allows to express flexible patterns (with misparings and indels) composed of both sequential and structural elements (such as repeats or pseudoknots). A web page on the GenOuest BioInformatics Platform http://www.genouest.org/ gives access to the Logol application. It includes an interface for graphically drawing the motif model and an interface to display the resulting matches within the targetted pattern. Logol is presented through an illustrative application using a quite intricate motif model, which is the detection of -1 ribosomal frameshifting events in messenger RNA sequences.
L'état de la pratique des outils de reconnaissance de motifs et l'écart qui peut être observé avec les besoins réels de modélisation des personnes en charge de l'analyse des structures génomiques montrent clairement le besoin de langages de plus haut niveau pour décrire et rechercher ces structures dans les séquences génomiques. Il apparaît ainsi nécessaire de proposer de nouveaux outils permettant de définir des modèles expressifs de familles de séquences biologiques, modèles basés à la fois sur le contenu et la structure des séquences. Cet article présente Logol, une application de reconnaissance de motifs conçue pour analyser des séquences potentiellement grandes avec des motifs biologiques réalistes. Logol est constitué d'un langage de description de motifs et de la suite logicielle associée, permettant de réaliser effectivement l'analyse de séquences (d'ADN, ARN ou protéines) avec ces motifs. Le langage, basé sur un formalisme grammatical de haut niveau, permet d'exprimer des motifs flexibles (autorisant substitutions et indels) composés à la fois d'éléments de séquences et de structures (tels que des répétitions ou des pseudo-noeuds). La suite logicielle est accessible sur le web, sur la plateforme bioinformatique GenOuest http://www.genouest.org/. Elle contient notamment deux interfaces, l'une pour dessiner graphiquement le modèle de motif et la seconde pour afficher les résultats comme des instances de ce modèle. Logol est présenté au travers d'une application illustrant les concepts utiles via l'utilisation d'un modèle de motif assez riche. Il s'agit de la détection d'événements de décalage de phase en -1 dans les ARN messagers.
Fichier principal
Vignette du fichier
logolPRF_jobim2012.pdf (447.83 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00726791 , version 1 (31-08-2012)

Identifiants

  • HAL Id : hal-00726791 , version 1

Citer

Catherine Belleannée, Olivier Sallou, Jacques Nicolas. Recherche d'instances de motifs expressifs avec Logol. Application à la modélisation d'événements de frameshift -1. JOBIM 2012- 13e Journées Ouvertes en Biologie, Informatique et Mathématiques, Jul 2012, Rennes, France. pp.5-14. ⟨hal-00726791⟩
366 Consultations
148 Téléchargements

Partager

Gmail Facebook X LinkedIn More