Fouille de texte et extraction d'informations dans les données cliniques - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2020

Text mining and information extraction in clinical data

Fouille de texte et extraction d'informations dans les données cliniques

Résumé

With the introduction of clinical data warehouses, more and more health data are available for research purposes. While a significant part of these data exist in structured form, much of the information contained in electronic health records is available in free text form that can be used for many tasks. In this manuscript, two tasks are explored: the multi-label classification of clinical texts and the detection of negation and uncertainty. The first is studied in cooperation with the Rennes University Hospital, owner of the clinical texts that we use, while, for the second, we use publicly available biomedical texts that we annotate and release free of charge. In order to solve these tasks, we propose several approaches based mainly on deep learning algorithms, used in supervised and unsupervised learning situations.
Avec la mise en place d'entrepôts de données cliniques, de plus en plus de données de santé sont disponibles pour la recherche. Si une partie importante de ces données existe sous forme structurée, une grande partie des informations contenues dans les dossiers patients informatisés est disponible sous la forme de texte libre qui peut être exploité pour de nombreuses tâches. Dans ce manuscrit, deux tâches sont explorées~: la classification multi-étiquette de textes cliniques et la détection de la négation et de l'incertitude. La première est étudiée en coopération avec le centre hospitalier universitaire de Rennes, propriétaire des textes cliniques que nous exploitons, tandis que, pour la seconde, nous exploitons des textes biomédicaux librement accessibles que nous annotons et diffusons gratuitement. Afin de résoudre ces tâches, nous proposons différentes approches reposant principalement sur des algorithmes d'apprentissage profond, utilisés en situations d'apprentissage supervisé et non-supervisé.
Fichier principal
Vignette du fichier
DALLOUX_Clement.pdf (1.48 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03081563 , version 1 (18-12-2020)
tel-03081563 , version 2 (31-03-2021)

Identifiants

  • HAL Id : tel-03081563 , version 2

Citer

Clément Dalloux. Fouille de texte et extraction d'informations dans les données cliniques. Base de données [cs.DB]. Université Rennes 1, 2020. Français. ⟨NNT : 2020REN1S050⟩. ⟨tel-03081563v2⟩
776 Consultations
643 Téléchargements

Partager

Gmail Facebook X LinkedIn More