Fouille de texte et extraction d'informations dans les données cliniques

Clément Dalloux

Thèse Année : 2020

Text mining and information extraction in clinical data

Fouille de texte et extraction d'informations dans les données cliniques

(1)

Clément Dalloux

Fonction : Auteur
PersonId : 1024781

Creating and exploiting explicit links between multimedia fragments

Résumé

With the introduction of clinical data warehouses, more and more health data are available for research purposes. While a significant part of these data exist in structured form, much of the information contained in electronic health records is available in free text form that can be used for many tasks. In this manuscript, two tasks are explored: the multi-label classification of clinical texts and the detection of negation and uncertainty. The first is studied in cooperation with the Rennes University Hospital, owner of the clinical texts that we use, while, for the second, we use publicly available biomedical texts that we annotate and release free of charge. In order to solve these tasks, we propose several approaches based mainly on deep learning algorithms, used in supervised and unsupervised learning situations.

Avec la mise en place d'entrepôts de données cliniques, de plus en plus de données de santé sont disponibles pour la recherche. Si une partie importante de ces données existe sous forme structurée, une grande partie des informations contenues dans les dossiers patients informatisés est disponible sous la forme de texte libre qui peut être exploité pour de nombreuses tâches. Dans ce manuscrit, deux tâches sont explorées~: la classification multi-étiquette de textes cliniques et la détection de la négation et de l'incertitude. La première est étudiée en coopération avec le centre hospitalier universitaire de Rennes, propriétaire des textes cliniques que nous exploitons, tandis que, pour la seconde, nous exploitons des textes biomédicaux librement accessibles que nous annotons et diffusons gratuitement. Afin de résoudre ces tâches, nous proposons différentes approches reposant principalement sur des algorithmes d'apprentissage profond, utilisés en situations d'apprentissage supervisé et non-supervisé.

Mots clés

NLP Sequence labeling Negation Speculation Multi-Label classification Clinical narratives

TALN Étiquetage de séquence Négation Incertitude Classification multi-Étiquette Textes cliniques

Domaines

Base de données [cs.DB]

Fichier principal

DALLOUX_Clement.pdf (1.48 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://hal.science/tel-03081563

Soumis le : mercredi 31 mars 2021-15:05:38

Dernière modification le : vendredi 24 mars 2023-14:53:21

Dates et versions

tel-03081563 , version 1 (18-12-2020)

tel-03081563 , version 2 (31-03-2021)

Identifiants

HAL Id : tel-03081563 , version 2

Citer

Clément Dalloux. Fouille de texte et extraction d'informations dans les données cliniques. Base de données [cs.DB]. Université Rennes 1, 2020. Français. ⟨NNT : 2020REN1S050⟩. ⟨tel-03081563v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA STAR CENTRALESUPELEC INRIA2 UR1-THESES UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

776 Consultations

643 Téléchargements

Text mining and information extraction in clinical data

Fouille de texte et extraction d'informations dans les données cliniques

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager