Qwant Research @DEFT 2019 : appariement de documents et extraction d'informations à partir de cas cliniques

Estelle Maudet; Oralie Cattan; Maureen de Seyssel; Christophe Servan

Communication Dans Un Congrès Année : 2019

Qwant Research @DEFT 2019: Document matching and information retrieval using clinical cases

Qwant Research @DEFT 2019 : appariement de documents et extraction d'informations à partir de cas cliniques

(1) , (1) , (1) , (1)

Estelle Maudet

Fonction : Auteur
PersonId : 1044558

QWANT RESEARCH

Oralie Cattan

Fonction : Auteur
PersonId : 747728
IdHAL : oralie-cattan

QWANT RESEARCH

Maureen de Seyssel

Fonction : Auteur

QWANT RESEARCH

Christophe Servan

Fonction : Auteur
PersonId : 4128
IdHAL : servan
ORCID : 0000-0003-2306-7075
IdRef : 147053609

QWANT RESEARCH

Résumé

This paper reports on Qwant Research contribution to tasks 2 and 3 of the DEFT 2019’s challenge, focusing on French clinical cases analysis. Task 2 is a task on semantic similarity between clinical cases and discussions. For this task, we propose an approach based on language models and evaluate the impact on the results of different preprocessings and matching techniques. For task 3, we have developed an information extraction system yielding very encouraging results accuracy-wise. We have experimented two different approaches, one based on the exclusive use of neural networks, the other based on a linguistic analysis.

Dans ce papier, nous présentons la participation de Qwant Research aux tâches 2 et 3 de l'édition 2019 du défi fouille de textes (DEFT 2019) portant cette année sur l'analyse de documents cliniques rédigés en français. La tâche 2 est une tâche de similarité sémantique qui demande d'apparier cas cliniques et discussions médicales deux à deux. Pour résoudre cette tâche, nous proposons une approche reposant sur des modèles de langue et évaluons l'impact de différents pré-traitements et de différentes techniques d'appariement sur les résultats. Pour la tâche 3, nous avons développé un système d'extraction d'information qui produit des résultats encourageants en terme de précision. Nous avons expérimenté deux approches différentes, l'une se fondant exclusivement sur l'utilisation de réseaux de neurones pour traiter la tâche, l'autre reposant sur l'exploitation des informations linguistiques issues d'une analyse syntaxique. ABSTRACT Document matching and information retrieval using clinical cases. This paper reports on Qwant Research contribution to tasks 2 and 3 of the DEFT 2019's challenge, focusing on French clinical cases analysis. Task 2 is a task on semantic similarity between clinical cases and discussions. For this task, we propose an approach based on language models and evaluate the impact on the results of different preprocessings and matching techniques. For task 3, we have developed an information extraction system yielding very encouraging results accuracy-wise. We have experimented two different approaches, one based on the exclusive use of neural networks, the other based on a linguistic analysis. MOTS-CLÉS : Similarité sémantique, extraction d'information, modèle de langues, modèle de vraisemblance de la requête, réseaux de neurones, analyse syntaxique.

Mots clés

Semantic similarity information extraction language model query likelihood model neural network syntactic analysis

Similarité sémantique extraction d’information modèle de langues modèle de vraisemblance de la requête réseaux de neurones analyse syntaxique

Domaines

Traitement du texte et du document

Fichier principal

DEFT2019.pdf (224.16 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Christophe Servan : Connectez-vous pour contacter le contributeur

https://hal.science/hal-02172582

Soumis le : mercredi 3 juillet 2019-22:26:12

Dernière modification le : jeudi 25 novembre 2021-15:12:06

Dates et versions

hal-02172582 , version 1 (03-07-2019)

Identifiants

HAL Id : hal-02172582 , version 1

Citer

Estelle Maudet, Oralie Cattan, Maureen de Seyssel, Christophe Servan. Qwant Research @DEFT 2019 : appariement de documents et extraction d'informations à partir de cas cliniques. Atelier Défi Fouilles de Texte 2019, Jul 2019, TOULOUSE, France. ⟨hal-02172582⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

188 Consultations

73 Téléchargements

Qwant Research @DEFT 2019: Document matching and information retrieval using clinical cases

Qwant Research @DEFT 2019 : appariement de documents et extraction d'informations à partir de cas cliniques

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Partager