Mesures de similarité entre trajectoires de soins issues de bases de données médico-administratives

Résumé : Bien que l’information dans les bases de données médico-administratives Françaises soit recueillie à des fins de gestion, elles contribuent aujourd’hui à la recherche en santé publique, par exemple pour l’analyse des parcours de soins et la surveillance du bon usage des produits de santé. Si le fait que ces données couvrent une très grande majorité de la population Française est leur principal atout, elles sont cependant d’une grande complexité. L’utilisation statistique de ces données massives nécessite une adaptation des méthodes d’analyse, notamment pour la comparaison des trajectoires de soins. Ainsi de nombreuses méthodes statistiques de comparaison ont été utilisées pour déterminer quels critères différenciaient des groupes de patients. La majorité de ces comparaisons sont faites sur des critères sociodémographiques, et lorsqu’elles sont faites sur des critères relevant de l’historique de soins et des diagnostics des patients, elles ne sont que rarement exhaustives. Dans l’objectif de mieux comprendre ce qui différencie un patient d’un autre, il est un atout de pouvoir déterminer la part commune de leur historique de soins, et ce en considérant la dimension temporelle des données. Si on voit les trajectoires de soins comme des séquences ponctuées d’événements, de nombreuses méthodes en informatique sont alors envisageables pour les comparer. Dans ce travail on se concentre sur la plus grande sous-séquence commune à deux trajectoires de soins, principe qui trouve déjà des applications dans des domaines variés allant de la correction d’orthographe à la biologie moléculaire. Du fait de la complexité des données, notamment la simultanéité ou l’incertitude quant à l’ordre entre certains événements, il est plus approprié de considérer un formalisme de séquences d’ensembles plutôt que celui des séquences simples. Nous avons donc généralisé la méthode à ce formalisme, en reconstituant les trajectoires de soins à partir des actes médicaux, diagnostics et délivrances de médicaments. Nous avons enrichi la méthode en prenant en compte des mesures de ressemblances entre événements, basées sur les structures hiérarchiques des vocabulaires contrôlés associés à ces événements médicaux. Une similarité fondée sur cette méthode peut alors être calculée entre deux trajectoires. Étant donné un échantillon de patients, il est alors possible de calculer toutes les similarités deux à deux entre trajectoires pour avoir une idée de leur part commune. Ces similarités peuvent également être utilisées à des fins statistiques dans des méthodes de classifications par exemple, dans le but de regrouper certaines trajectoires, et donc certains patients, par groupes homogènes.
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01915618
Contributor : Yann Rivault <>
Submitted on : Wednesday, November 7, 2018 - 5:58:04 PM
Last modification on : Friday, September 13, 2019 - 9:49:21 AM
Long-term archiving on: Friday, February 8, 2019 - 3:17:34 PM

File

poster_rd_Yann_Rivault.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01915618, version 1

Citation

Yann Rivault, Nolwenn Le Meur, Olivier Dameron. Mesures de similarité entre trajectoires de soins issues de bases de données médico-administratives. 8 èmes rencontres scientifiques du réseau doctoral en santé publique, Mar 2017, Rennes, France. pp.1. ⟨hal-01915618⟩

Share

Metrics

Record views

88

Files downloads

59