Exploitation de reformulations pour l'acquisition d'un vocabulaire expert/non expert - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Exploitation de reformulations pour l'acquisition d'un vocabulaire expert/non expert

Résumé

Exploitation of reformulations for the acquisition of expert/non-expert vocabulary. Notions from technical areas, such as medicine, often present understanding difficulties for non-expert people. A vocabulary which associates technical terms with expressions used by lay people can help in making the technical texts easier to understand. The purpose of this work is to build such vocabulary. We propose to exploit the notion of reformulation through three methods : extraction of abbreviations, exploitation of reformulation markers, and of parentheses. The segments associated with these methods are then aligned with medical terminologies. Our results cover a large number of medical terms and show between 0.68 and 0.98 extraction precision. On the whole, several dozens of thousands of pairs are proposed. These results are analyzed and compared with the existing work. MOTS-CLÉS : Reformulation, extraction d'information, terminologie médicale, langage profane.
Les notions de domaines techniques, comme les notions médicales, présentent souvent des difficultés de compréhension par les non experts. Un vocabulaire qui associe les termes techniques aux expressions grand public peut aider à rendre les textes techniques mieux compréhensibles. L'objectif de notre travail est de construire un tel vocabulaire. Nous proposons d'exploiter la notion de reformulation grâce à trois méthodes : extraction d'abréviations, exploitation de marqueurs de reformulation et de parenthèses. Les segments associés grâce à ces méthodes sont alignés avec les terminologies médicales. Nos résultats permettent de couvrir un grand nombre de termes médicaux et montrent une précision d'extraction entre 0,68 et 0,98. Au total, plusieurs dizaines de milliers de paires sont proposés. Ces résultats sont analysés et comparés avec les travaux existants.
Fichier principal
Vignette du fichier
antoine-TALN2016.pdf (155.86 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01426816 , version 1 (04-01-2017)

Identifiants

  • HAL Id : hal-01426816 , version 1

Citer

Edwide Antoine, Natalia Grabar. Exploitation de reformulations pour l'acquisition d'un vocabulaire expert/non expert. TALN 2016: Traitement Automatique des Langues Naturelles, Jul 2016, Paris, France. ⟨hal-01426816⟩
163 Consultations
400 Téléchargements

Partager

Gmail Facebook X LinkedIn More