Création d'un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Création d'un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines

Résumé

Nous présentons des travaux en cours vers la création d’un corpus diachronique de pièces de théâtre en alsacien pour la période 1870-1940, publiquement disponible, encodé selon les recommandations de la Text Encoding Initiative (TEI) et suivant les principes FAIR pour la création de données de la recherche. Le corpus sera utile aux recherches en sociolinguistique historique et analyse dramatique. Nous décrivons le travail effectué en vue des pratiques FAIR et introduisons des questions de recherche en modélisation TEI de variables pertinentes pour l’analyse linguistique et dramatique. De façon générale, la création du corpus est un exemple des difficultés du travail avec les langues peu dotées. Particulièrement, le corpus présente de l’alternance codique et d’énormes défis pour la normalisation orthographique automatique, sur lesquels nous aimerions échanger avec la communauté.
Fichier principal
Vignette du fichier
7.pdf (416.31 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03047152 , version 1 (03-01-2021)

Identifiants

  • HAL Id : hal-03047152 , version 1

Citer

Pablo Ruiz Fabo, Delphine Bernhard, Carole Werner. Création d'un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines. 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT), 2020, Montrouge, France. pp.34-43. ⟨hal-03047152⟩
168 Consultations
73 Téléchargements

Partager

Gmail Facebook X LinkedIn More