La glose, le document électronique et l'extraction automatisée.
Résumé
Dans cet article, nous nous intéressons au repérage et à l'extraction de candidats glose, à partir de données sous format électronique, et ce, au moyen de méthodes en traitement automatique des langues (TAL). En premier lieu, nous décrivons le parcours allant de la constitution du corpus jusqu'à l'étiquetage morpho-syntaxique, en passant par l'épuration des données. Nous réfléchirons ensuite au processus de repérage et d'extraction proprement dit, en nous posant les questions suivantes : que peut-on repérer à l'aide d'un traitement automatisé ? quelles sont les limites actuelles de ce type de démarche ?
Domaines
Linguistique
Origine : Fichiers produits par l'(les) auteur(s)
Loading...