Traitement automatisé de la néologie : pourquoi et comment intégrer l'analyse thématique ?
Résumé
Cet article a pour cadre un projet en cours nommé Logoscope et développé à l'Université de Strasbourg (2012-2015). Le coeur de ce projet se constitue d'un programme informatique qui, chaque jour, scrute les pages web de la presse quotidienne francophone (Le Monde, La Croix, L'Equipe, Dernières Nouvelles d'Alsace, etc.) à la recherche de mots nouveaux, dans le but constituer une ressource dynamique (i.e. enrichie sans limite dans le temps) utile à différentes communautés d'utilisateurs. L'originalité du Logoscope le distingue des outils similaires existants : contrairement ces derniers, l'acquisition semi-automatisée des néologismes intègre d'emblée les conditions textuelles et discursives de l'innovation lexicale. Cette direction de recherche est en effet essentielle : dans le domaine de la néologie, tout ce que nous savons déjà de la morphologie d'une langue et des types de formation des mots devrait être complété par une description des conditions de production et de réception des néologismes, étant donné qu'aucune création lexicale ne se produit jamais en dehors d'un texte particulier et d'une situation de communication définie. Pratiquement, nous proposons donc un outil d'acquisition et une ressource néologique qui documente non seulement les néologismes au moyen des variables traditionnelles (morphologie, formation du mot, parties du discours, etc.), mais aussi au moyen de variables chargées de décrire dans quel contexte communicationnel précis ils apparaissent.
Domaines
Traitement du texte et du document
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...