Skip to Main content Skip to Navigation
Conference papers

Identification of complex words and passages in medical documents in French

Abstract : Identification de mots et passages difficiles dans les documents médicaux en français. L’objectif de la simplification automatique des textes consiste à fournir une nouvelle version de documents qui devient plus facile à comprendre pour une population donnée ou plus facile à traiter par d’autres applications du TAL. Cependant, avant d’effectuer la simplification, il est important de savoir ce qu’il faut simplifier exactement dans les documents. En effet, même dans les documents techniques et spécialisés, il n’est pas nécessaire de tout simplifier mais juste les segments qui présentent des difficultés de compréhension. Il s’agit typiquement de la tâche d’identification de mots complexes : effectuer le diagnostic de difficulté d’un document donné pour y détecter les mots et passages complexes. Nous proposons de travail sur l’identification de mots et passages complexes dans les documents biomédicaux en français.
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-03701486
Contributor : Yannick Parmentier Connect in order to contact the contributor
Submitted on : Friday, June 24, 2022 - 4:41:22 PM
Last modification on : Thursday, July 7, 2022 - 5:41:51 AM

File

2891.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-03701486, version 1

Citation

Kim Cheng Sheang, Anaïs Koptient, Natalia Grabar, Horacio Saggion. Identification of complex words and passages in medical documents in French. Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.116-125. ⟨hal-03701486⟩

Share

Metrics

Record views

5

Files downloads

1