La morphologie dans la Banque de Données Langue Corse : bilan et perspectives - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Corpus Année : 2022

Morphology in the Corsican Language Database (BDLC) : assessment and perspectives

La morphologie dans la Banque de Données Langue Corse : bilan et perspectives

Résumé

Since the late 1970s, the NALC-BDLC programme has been collecting dialectal data from native speakers throughout Corsica and northern Sardinia. Ethnolinguistic field surveys are conducted in the form of semi-directed interviews with the help of thematic questionnaires. This long-term undertaking has made it possible to gather a rich linguistic material, but has also undergone various methodological and technological evolutions, making the current version partial. Before describing the analysis carried out to fill these gaps, the possibilities offered today are outlined and put into perspective in relation to those of the historical version. However, our approach goes beyond the "simple restoration" of the system and is planned in two directions: on the one hand, the implementation of a research project that will strengthen the morphological and syntactic dimensions of the database, and on the other hand, the application of Natural Language Processing (NLP) techniques for the development of the programme.
Depuis la fin des années 1970, le programme NALC-BDLC collecte des données dialectales auprès de locuteurs natifs dans l’ensemble de la Corse et dans le nord de la Sardaigne. Les enquêtes ethnolinguistiques de terrain sont menées sous la forme d’entretiens semi-dirigés avec l’aide de questionnaires thématiques. Cette entreprise au long cours a permis de rassembler un matériel linguistique riche, mais a parallèlement connu diverses évolutions – méthodologiques et technologiques – rendant la version actuelle partielle. Avant de décrire l’analyse menée pour combler ces déficits, les possibilités offertes aujourd’hui sont exposées et mises en perspectives par rapport à celles de la version historique. Notre démarche dépasse cependant la « simple restauration » du système et s’envisage en deux directions : d’une part la mise en œuvre d’un projet de recherches qui renforcera les dimensions morphologie et syntaxe de la base, d’autre part l’application des techniques du Traitement Automatique du Langage (TAL) pour le développement du programme.

Dates et versions

hal-03591866 , version 1 (28-02-2022)

Identifiants

Citer

Stella Retali Medori, Laurent Kevers. La morphologie dans la Banque de Données Langue Corse : bilan et perspectives. Corpus, 2022, Corpus et données en morpholgie, 23, ⟨10.4000/corpus.7115⟩. ⟨hal-03591866⟩
50 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More