L’avenir numérique des langues minoritaires : bilan du projet RESTAURE pour l’alsacien, l’occitan et le picard - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Les Cahiers du GEPE Année : 2020

L’avenir numérique des langues minoritaires : bilan du projet RESTAURE pour l’alsacien, l’occitan et le picard

Résumé

Die Einführung digitaler Technologien ist eine der Herausforderungen bei der Revitalisierung von Minderheitensprachen. Die Computerisierung dieser Sprachen hat jedoch eine geringe Rentabilität, die die erheblichen Entwicklungskosten nicht ausgleicht. Die Herausforderung, digitale Ressourcen und Werkzeuge für diese Sprachen zu schaffen, ist daher beträchtlich. Das Projekt RESTAURE (Ressources informatisées et Traitement Automatique pour les langues régionales), das von der französischen projektbasierten Förderstelle für Forschung ANR (2015-2018) finanziert worden ist, hatte zum Ziel, digitale Ressourcen bereitzustellen, insbesondere durch die Erstellung von Korpora und Lexika sowie automatische Sprachverarbeitungswerkzeuge für drei Regionalsprachen Frankreichs: Elsässisch, Okzitanisch und Picard. In diesem Artikel stellen wir die Ergebnisse des RESTAURE-Projekts vor, insbesondere die methodischen Herausforderungen, die aufgeworfen wurden - seltene und verstreute digitale Daten, dialektale und grafische Variationen, unvollständige Sprachbeschreibungen - sowie die Lösungsvorschläge - Zusammenarbeit, Verwendung von Standards. Wir ziehen auch die wichtigsten Lehren aus diesem Projekt, von denen wir hoffen, dass sie für andere Forscher und für andere Sprachen von Nutzen sein werden.
Digital technology is one of the challenges in the revitalization of minority languages. However, the computerization of these languages has a low profitability that does not compensate for significant development costs. The challenge of creating digital resources and tools for these languages is therefore considerable. The RESTAURE project (Ressources informatisées et Traitement Automatique pour les langues régionales), funded by the project-based funding agency for research in France ANR (2015-2018), aimed to provide digital resources, in particular through the constitution of corpora and lexicons, and automatic language processing tools for three regional languages of France: Alsatian, Occitan and Picard. In this article, we present the results of the RESTAURE project, and in particular the methodological challenges that were raised - rare and scattered digital data and tools, dialectal and graphic variations, incomplete language descriptions - as well as the solutions that were proposed - cooperation, use of standards. We also draw the main lessons from this project, which we hope will be useful to other researchers and to other languages.
Le numérique est un des enjeux de la revitalisation des langues minoritaires. Or, l’informatisation de ces langues a une faible rentabilité qui ne compense pas des coûts de développement importants. Le défi que constitue la constitution de ressources et d’outils numériques pour ces langues est donc considérable. Le projet RESTAURE (Ressources informatisées et Traitement Automatique pour les langues régionales), financé par l’ANR (2015-2018) a eu pour objectif de fournir des ressources numériques, en particulier à travers la constitution de corpus et lexiques, et d’outils de traitement automatique des langues pour trois langues régionales de France : l’alsacien, l’occitan et le picard. Dans cet article, nous présentons le bilan du projet RESTAURE, et en particulier les défis méthodologiques qui ont été soulevés – données et outils numériques rares et éparses, variations dialectales et graphiques, descriptions des langues incomplètes – ainsi que les solutions qui ont été proposées – coopération, utilisation de standards. Nous tirons également les leçons principales de ce projet qui, nous l’espérons, pourront être utiles à d’autres chercheurs et à d’autres langues.
Fichier principal
Vignette du fichier
cpe-1253.pdf (475.96 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-02378172 , version 1 (30-09-2022)

Licence

Paternité - Partage selon les Conditions Initiales

Identifiants

Citer

Delphine Bernhard, Myriam Bras, Anne-Laure Ligozat, Aleksandra Miletic, Jean Sibille, et al.. L’avenir numérique des langues minoritaires : bilan du projet RESTAURE pour l’alsacien, l’occitan et le picard. Les Cahiers du GEPE, 2020, Langues minoritaires : Quels acteurs pour quel avenir ?, 12, ⟨10.57086/cpe.1253⟩. ⟨hal-02378172⟩
293 Consultations
70 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More