Qwant Research @DEFT 2019 : appariement de documents et extraction d'informations à partir de cas cliniques - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Qwant Research @DEFT 2019: Document matching and information retrieval using clinical cases

Qwant Research @DEFT 2019 : appariement de documents et extraction d'informations à partir de cas cliniques

Estelle Maudet
  • Fonction : Auteur
  • PersonId : 1044558
Oralie Cattan
Christophe Servan

Résumé

This paper reports on Qwant Research contribution to tasks 2 and 3 of the DEFT 2019’s challenge, focusing on French clinical cases analysis. Task 2 is a task on semantic similarity between clinical cases and discussions. For this task, we propose an approach based on language models and evaluate the impact on the results of different preprocessings and matching techniques. For task 3, we have developed an information extraction system yielding very encouraging results accuracy-wise. We have experimented two different approaches, one based on the exclusive use of neural networks, the other based on a linguistic analysis.
Dans ce papier, nous présentons la participation de Qwant Research aux tâches 2 et 3 de l'édition 2019 du défi fouille de textes (DEFT 2019) portant cette année sur l'analyse de documents cliniques rédigés en français. La tâche 2 est une tâche de similarité sémantique qui demande d'apparier cas cliniques et discussions médicales deux à deux. Pour résoudre cette tâche, nous proposons une approche reposant sur des modèles de langue et évaluons l'impact de différents pré-traitements et de différentes techniques d'appariement sur les résultats. Pour la tâche 3, nous avons développé un système d'extraction d'information qui produit des résultats encourageants en terme de précision. Nous avons expérimenté deux approches différentes, l'une se fondant exclusivement sur l'utilisation de réseaux de neurones pour traiter la tâche, l'autre reposant sur l'exploitation des informations linguistiques issues d'une analyse syntaxique. ABSTRACT Document matching and information retrieval using clinical cases. This paper reports on Qwant Research contribution to tasks 2 and 3 of the DEFT 2019's challenge, focusing on French clinical cases analysis. Task 2 is a task on semantic similarity between clinical cases and discussions. For this task, we propose an approach based on language models and evaluate the impact on the results of different preprocessings and matching techniques. For task 3, we have developed an information extraction system yielding very encouraging results accuracy-wise. We have experimented two different approaches, one based on the exclusive use of neural networks, the other based on a linguistic analysis. MOTS-CLÉS : Similarité sémantique, extraction d'information, modèle de langues, modèle de vraisemblance de la requête, réseaux de neurones, analyse syntaxique.
Fichier principal
Vignette du fichier
DEFT2019.pdf (224.16 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02172582 , version 1 (03-07-2019)

Identifiants

  • HAL Id : hal-02172582 , version 1

Citer

Estelle Maudet, Oralie Cattan, Maureen de Seyssel, Christophe Servan. Qwant Research @DEFT 2019 : appariement de documents et extraction d'informations à partir de cas cliniques. Atelier Défi Fouilles de Texte 2019, Jul 2019, TOULOUSE, France. ⟨hal-02172582⟩
188 Consultations
73 Téléchargements

Partager

Gmail Facebook X LinkedIn More