Présent, hypothétique, conditionnel ? Annotation du statut des problèmes médicaux dans des comptes-rendus cliniques en français
Résumé
Dans le but d'extraire automatiquement le statut (présent, absent, possible. . .) d'un problème médical cité dans un document, l'utilisation d'une ressource annotée est nécessaire. Cet article présente une méthode d'annotation d'assertions dans un corpus français de comptes-rendus médicaux. L'annotation concerne des concepts (ou problèmes médicaux), des catégories d'assertions (valeurs de vérité associées aux concepts) et des justifications du choix d'assertion donné à un concept. Une annotation manuelle a été effectuée en plusieurs phases en observant l'accord inter-annotateur, sur la base d'un guide d'annotation précis. Nous présentons les choix d'annotation effectués, et les difficultés d'annotation, puis les caractéristiques du travail d'annotation et du corpus obtenu. Ce corpus permettra de développer des systèmes d'extraction d'information dans des comptes-rendus médicaux en français.
Domaines
Traitement du texte et du document
Origine : Fichiers produits par l'(les) auteur(s)
Loading...