Le projet ConDÉ : présentation. Les défis d’un corpus de textes en diachronie longue - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Le projet ConDÉ : présentation. Les défis d’un corpus de textes en diachronie longue

Résumé


Le projet RIN CONDÉ (CONstitution d’un Droit europÉen : six siècles de coutumiers nor­mands), financé par la région Normandie, se consacre à l’histoire de la Coutume de Normandie, jusqu’à présent surtout étudiée selon les circonstances de sa constitution, du XIIIe au XVIIIe siècles. Ce projet propose de considérer ces textes comme des témoignages précieux relatifs à l’histoire du droit, notamment dans les rapports à la jurisprudence et au pouvoir temporel; du point de vue historique, le travail fait sur les versions et le nombre de manuscrits propose un panorama de la structuration de l’écrit et de son économie dans le domaine juridique; enfin, ce matériau abondant est une source précieuse quant à une analyse linguistique diachronique, par l’intermédiaire de textes précisément datés et localisés.

CONDÉ édifie une base de données interrogeable en ligne, accessible à la communauté des chercheurs comme des professionnels du droit ou des enseignants de l’ancienne langue, reflétant l’évolution et l’élaboration du droit en Normandie. Ce projet demande à surmonter un certain nombre de difficultés : en amont, par l’inventaire et la sélection des coutumiers représentatifs; puis par les défis qu’engagent la transcription, la numérisation et l’étiquetage syntaxique des textes; enfin, par les diffusions potentielles d’un tel corpus, jamais envisagé sous cet angle jus­qu’à présent.

Nous présenterons notre corpus sous ses aspects techniques, en nous inscrivant dans le champ contemporain des Humanités Numériques d’une part, de la linguistique de corpus de l’autre, et nous présenterons la façon dont nous avons retranscrit la spécificité de ce corpus, enrichi d’un appareillage scientifique impliquant (i) une numérisation et une transcription de ces différents témoins; (ii) un système de renvoi et de navigation permettant un accès intelligent à leurs diffé­rents contenus; (iii) une lemmatisation et un étiquetage morphosyntaxique, permettant de faire des recherches fines au sein des textes.

Lire la suite du résumé dans le livret des résumés disponible sur : https://jlc2019.sciencesconf.org/data/pages/JLC_Xe.pdf . (p. 51 à 54)

Domaines

Linguistique
Fichier non déposé

Dates et versions

hal-02447030 , version 1 (21-01-2020)

Identifiants

  • HAL Id : hal-02447030 , version 1

Citer

Mathieu Goux, Morgane Pica. Le projet ConDÉ : présentation. Les défis d’un corpus de textes en diachronie longue. 10e Journées Internationales de Linguistique de Corpus (JLC2019), Nov 2019, Grenoble, France. ⟨hal-02447030⟩
79 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More