Fouille de motifs séquentiels pour la découverte de relations entre gènes et maladies rares - Archive ouverte HAL Access content directly
Journal Articles Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle Year : 2014

Sequential pattern mining in order to discover relations between genes and rares diseases

Fouille de motifs séquentiels pour la découverte de relations entre gènes et maladies rares

Peggy Cellier
Thierry Charnois

Abstract

Orphanet provides an international web-based knowledge portal for rare diseases including a collection of review articles. However, reviews and literature monitoring are manual. Thus, new documentation about a rare disease is a time-consuming process and automatically discovering knowledge from a large collection of texts is a crucial issue. This context represents a strong motivation to address the problem of extracting gene–rare diseases relationships from texts. In this paper, we tackle this issue with a cross-fertilization of information extraction and data mining techniques (sequential pattern mining under constraints). Experiments show the interest of the method for the documentation of rare diseases.
Orphanet est un organisme dont l'objectif est notamment de rassembler des collections d'articles traitant de maladies rares. Cependant, l'acquisition de nouvelles connaissances dans ce domaine est actuellement réalisée manuellement. Dès lors, obtenir de nouvelles informations relatives aux maladies rares est un processus chronophage. Permettre d'obtenir ces informations de manière automatique est donc un enjeu important. Dans ce contexte, nous proposons d'aborder la question de l'extraction de relations entre gènes et maladies rares en utilisant des approches de fouille de données, plus particulièrement de fouille de motifs séquentiels sous contraintes. Nos expérimentations montrent l'intérêt de notre approche pour l'extraction de relations entre gènes et maladies rares à partir de résumés d'articles de PubMed.
No file

Dates and versions

hal-01119525 , version 1 (23-02-2015)

Identifiers

  • HAL Id : hal-01119525 , version 1

Cite

Nicolas Béchet, Peggy Cellier, Thierry Charnois, Bruno Crémilleux. Fouille de motifs séquentiels pour la découverte de relations entre gènes et maladies rares. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2014, 28/2-3, pp.245-270. ⟨hal-01119525⟩
334 View
0 Download

Share

Gmail Facebook X LinkedIn More