Skip to Main content Skip to Navigation
Conference papers

Louis Meigret et la réutilisabilité des données

Cendrine Pagani 1, 2 Laurent Vanni 3
1 Centre Alfred Ernout - Linguistique latine
Linguistique et Lexicologie romanes et latines : EA4080, CNRS - Centre National de la Recherche Scientifique : GDR2650
2 BCL, équipe Linguistique de l’énonciation
BCL - Bases, Corpus, Langage (UMR 7320 - UCA / CNRS)
3 BCL, équipe Logométrie : corpus, traitements, modèles
BCL - Bases, Corpus, Langage (UMR 7320 - UCA / CNRS)
Résumé : La question de la réutilisation des données est au cœur du projet de la Base Louis Meigret. Au-delà des gestes techniques que suppose la mise à disposition de données réutilisables, c’est un principe adéquat à la singularité de l’œuvre de Louis Meigret. Le projet est né à l’occasion du colloque consacré à cet auteur en 2018 à Nice. Il s’agissait au départ de créer un lieu de référence, destiné à favoriser les échanges entre chercheurs. Les personnes qui travaillent sur Meigret ne se connaissent pas toujours, et pour peu qu’elles évoluent dans des cercles différents, ignorent leurs activités respectives. Au moment du colloque une base venait d’être mise en ligne (Bettens 2017), parallèlement, et à peu près à la même époque, Le Tretté faisait l’objet d’une transcription par A. Pelfrêne et B. Colombat (mise en ligne sur le site du CTLF). Ce doublon, outre la fragmentation qu’il manifeste, rappelait un déséquilibre : la surexposition de certaines œuvres du grammairien, notamment Le Tretté de la grammere françoeze, et le relatif oubli de l’œuvre traduite. En outre, les œuvres linguistiques – et particulièrement Le Tretté - ont elles-mêmes été enfermées dans des modes de lecture qui en occultent bien des dimensions. Compte tenu de la grande diversité des travaux suscités par Louis Meigret (histoire de la langue, histoire des idées, histoire des techniques, histoire du livre), ce que devait offrir cette base à l’usager était à définir (ou peut-être à ne pas définir). D’emblée donc s’est posée la question de la réutilisation : réutilisation des données existantes (la base conçue par O. Bettens), réutilisation de celles qu’on envisageait de mettre à disposition des futurs usagers (l’intégralité de l’œuvre de Louis Meigret, textes personnels et traductions). Le projet était a minima de rassembler l’ensemble des textes, de faciliter la circulation d’un texte à l’autre, et de faire jaillir la cohérence quasiment organique de l’œuvre de Louis Meigret. Il s’agissait de permettre une appréhension globale de l’œuvre, tout en conservant la possibilité de revenir à la spécificité de chaque texte, sans l’assigner a priori à un genre (traité sur la langue / traduction), sans conditionner sa lecture par un outillage envahissant qui le rendrait « illisible » sous d’autres approches. Toutes les recommandations favorisant la réutilisation des données rejoignent donc la conviction que pour mieux connaître l’œuvre de Louis Meigret, l’essentiel réside dans la liberté laissée à l’usager (qu’il soit chercheur ou lecteur non expert) de choisir son mode de lecture (choix du support, choix des outils de visualisation et d’exploration), de réinventer le texte en modulant les points de vue. La base est à l’heure actuelle dans une phase intermédiaire : elle est utilisable mais en train de se faire. Utilisable parce que les traductions ont été numérisées (pour celles qui ne l’étaient pas), transcrites et mises en ligne sur le site d’Hyperbase, avec toutes les fonctionnalités que permet cet outil. La matière est disponible mais encore partiellement fragmentée, et pas forcément réutilisable. Il convient de réfléchir à la manière de faire fusionner les deux bases existantes : celle qui rassemble les traductions et celle qui concerne les textes en graphie rénovée. Les deux ensembles ont leur cohérence interne mais cela ne justifie pas une dualité que dément la démarche originale de Meigret. Démarche qui se manifeste de manière exemplaire dans une œuvre comme Le Menteur. Le Menteur est une œuvre bicéphale. Par sa préface, c’est un traité sur l’orthographe. Intégralement composé en graphie rénovée, il appartient à la base conçue par O. Bettens qui rassemble les autres textes de Meigret relatifs à la langue française publiés chez C. Wechel. Conserver les particularités graphiques et ménager un accès au support original est donc crucial. Mais Le Menteur intéresse aussi l’histoire de la traduction : le dialogue de Lucien engage vers d’autres formes de lecture et d’exploration qui peuvent justifier son intégration à la base des traductions, et à d’autres corpus (alignement avec les textes sources et les traductions ultérieures). Enfin reste à définir l’interface qui permettra de répondre aux questions qui ont motivé la création de l’outil tout en restant disponible pour des investigations nouvelles. Un projet d’édition collective sur les traductions de Louis Meigret doit créer les conditions d’un dialogue entre chercheurs d’horizons divers, et permettre à l’usager d’expérimenter l’outil et d’en suggérer des améliorations. On voudrait en somme que l’usager crée la base et puisse la recréer à chaque moment.
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-03525241
Contributor : Cendrine Pagani-Naudet Connect in order to contact the contributor
Submitted on : Thursday, January 13, 2022 - 5:07:53 PM
Last modification on : Tuesday, January 18, 2022 - 6:35:38 PM

Identifiers

  • HAL Id : hal-03525241, version 1

Citation

Cendrine Pagani, Laurent Vanni. Louis Meigret et la réutilisabilité des données. 10 ans avec CAHIER. Des corpus d'auteurs pour les humanités à leur exploitation numérique, Jun 2021, Bordeaux, France. ⟨hal-03525241⟩

Share

Metrics

Les métriques sont temporairement indisponibles