Analyse outillée des données textuelles et genres de discours
Résumé
La présente contribution fait écho à une communication faite par Maurice Kauffer lors du 25e anniversaire de l’AGES, dans laquelle il exhortait le linguiste germaniste à s’approprier les outils de la statistique pour les appliquer à son objet d’étude. C’est ce qui lui a notamment permis, dans son étude des lexèmes composés, de calculer la puissance du déterminé, à savoir « la capacité d’un lexème à entrer comme déterminé dans un composé ». Depuis, son souhait de voir la statistique davantage au service de la linguistique a été exaucé avec l’avènement des logiciels dits de textométrie. C’est pourquoi, 25 ans plus tard, à l’occasion du 50e anniversaire de l’AGES, la présente réflexion souhaite revenir sur la question de l’irruption de la statistique, via la machine, dans le champ de recherche du linguiste.
Il convient dans un premier temps de revenir sur l’opposition humain/machine telle qu’elle a été déjà discutée – et, semble-t-il, dépassée – dans les travaux de recherche de ces dernières années. Puis nous nous focaliserons sur un exemple précis, celui de l’étude des adjectifs évaluatifs dans les recensions littéraires journalistiques à l’aide des logiciels TXM et Iramuteq. Enfin, nous ouvrirons la discussion sur les limites de la machine, notamment au regard de la notion de genre.