Interrogation de bases de données biologiques publiques par reformulation de requêtes et classement des résultats avec ConQuR-Bio

Bryan Brancotte 1 Bastien Rance 2 Alain Denise 1 Sarah Cohen-Boulakia 1, 3, 4, 5
3 ZENITH - Scientific Data Management
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, CRISAM - Inria Sophia Antipolis - Méditerranée
4 VIRTUAL PLANTS - Modeling plant morphogenesis at different scales, from genes to phenotype
CRISAM - Inria Sophia Antipolis - Méditerranée , INRA - Institut National de la Recherche Agronomique, Centre de coopération internationale en recherche agronomique pour le développement [CIRAD] : UMR51
Abstract : L’analyse d'expériences bioinformatiques comprend la comparaison des nouveaux résultats obtenus aux données existantes. Durant ces trente dernières années, les scientifiques ont du faire face à une avalanche de données, de différents types, et présentes dans une multitude de bases de données publiques. L’accès aux données publiques se fait par l’interrogation de portails (tels que le portail Entrez du NCBI) au moyen de mots clés. Cependant, deux requêtes très similaires peuvent fournir des ensembles de réponses différents conduisant l’utilisateur à devoir tester différentes reformulations de ses requêtes (termes synonymes, variantes orthographiques, abréviations).... Les résultats obtenus doivent ensuite être filtrés, comparés... En outre, chaque ensemble de résultats est classé par le portail (en utilisant le nombre d'occurrences du mot-clé dans chaque résultat). Cependant, lorsque plusieurs reformulations sont considérées, il n'est pas simple de produire un classement triant par ordre de pertinence l'ensemble des résultats recueillis séparément, d'autant que ces résultats peuvent être fournis par centaines. Dans cette démonstration, nous présentons ConQuR-Bio (http://conqur-bio.lri.fr) qui permet aux utilisateurs d'interroger les bases de données publiques du NCBI tout en générant automatiquement toutes les reformulations possibles et fournit des réponses triées en utilisant des techniques de consensus de classement (ou agrégation de classements). Notre démonstration montrera l’intérêt de notre approche pour des requêtes biomédicales, lors de la recherche de gènes issus d’EntrezGene et impliqués dans des maladies.
Type de document :
Poster
JOBIM (Journées Ouvertes Biologie Informatique Mathématiques), Jul 2015, Clermont-Ferrand, France
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01167840
Contributeur : Sarah Cohen-Boulakia <>
Soumis le : mardi 1 décembre 2015 - 11:22:51
Dernière modification le : vendredi 9 juin 2017 - 10:39:53

Identifiants

  • HAL Id : hal-01167840, version 1

Citation

Bryan Brancotte, Bastien Rance, Alain Denise, Sarah Cohen-Boulakia. Interrogation de bases de données biologiques publiques par reformulation de requêtes et classement des résultats avec ConQuR-Bio. JOBIM (Journées Ouvertes Biologie Informatique Mathématiques), Jul 2015, Clermont-Ferrand, France. <hal-01167840>

Partager

Métriques

Consultations de la notice

189