Identification of complex words and passages in medical documents in French - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Identification of complex words and passages in medical documents in French

Kim Cheng Sheang
  • Fonction : Auteur
  • PersonId : 1144133
Horacio Saggion
  • Fonction : Auteur
  • PersonId : 1006501

Résumé

Identification de mots et passages difficiles dans les documents médicaux en français. L’objectif de la simplification automatique des textes consiste à fournir une nouvelle version de documents qui devient plus facile à comprendre pour une population donnée ou plus facile à traiter par d’autres applications du TAL. Cependant, avant d’effectuer la simplification, il est important de savoir ce qu’il faut simplifier exactement dans les documents. En effet, même dans les documents techniques et spécialisés, il n’est pas nécessaire de tout simplifier mais juste les segments qui présentent des difficultés de compréhension. Il s’agit typiquement de la tâche d’identification de mots complexes : effectuer le diagnostic de difficulté d’un document donné pour y détecter les mots et passages complexes. Nous proposons de travail sur l’identification de mots et passages complexes dans les documents biomédicaux en français.
Fichier principal
Vignette du fichier
2891.pdf (227.58 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03701486 , version 1 (24-06-2022)

Identifiants

  • HAL Id : hal-03701486 , version 1

Citer

Kim Cheng Sheang, Anaïs Koptient, Natalia Grabar, Horacio Saggion. Identification of complex words and passages in medical documents in French. Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.116-125. ⟨hal-03701486⟩
24 Consultations
17 Téléchargements

Partager

Gmail Facebook X LinkedIn More