Exploitation de reformulations pour l'acquisition d'un vocabulaire expert/non expert
Résumé
Exploitation of reformulations for the acquisition of expert/non-expert vocabulary. Notions from technical areas, such as medicine, often present understanding difficulties for non-expert people. A vocabulary which associates technical terms with expressions used by lay people can help in making the technical texts easier to understand. The purpose of this work is to build such vocabulary. We propose to exploit the notion of reformulation through three methods : extraction of abbreviations, exploitation of reformulation markers, and of parentheses. The segments associated with these methods are then aligned with medical terminologies. Our results cover a large number of medical terms and show between 0.68 and 0.98 extraction precision. On the whole, several dozens of thousands of pairs are proposed. These results are analyzed and compared with the existing work. MOTS-CLÉS : Reformulation, extraction d'information, terminologie médicale, langage profane.
Les notions de domaines techniques, comme les notions médicales, présentent souvent des difficultés de compréhension par les non experts. Un vocabulaire qui associe les termes techniques aux expressions grand public peut aider à rendre les textes techniques mieux compréhensibles. L'objectif de notre travail est de construire un tel vocabulaire. Nous proposons d'exploiter la notion de reformulation grâce à trois méthodes : extraction d'abréviations, exploitation de marqueurs de reformulation et de parenthèses. Les segments associés grâce à ces méthodes sont alignés avec les terminologies médicales. Nos résultats permettent de couvrir un grand nombre de termes médicaux et montrent une précision d'extraction entre 0,68 et 0,98. Au total, plusieurs dizaines de milliers de paires sont proposés. Ces résultats sont analysés et comparés avec les travaux existants.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...