Les corpus plurilingues, entre linguistique de corpus et linguistique de contact
Résumé
Contact linguistics is a thriving area of research. There are two broad lines of research. The first one, from a diachronic perspective, focuses on the description of the outcomes of contact and its impact on the languages involved. The other one takes a synchronic approach and explores the social and linguistic effects of on- going contact settings involving multilingualism and code alternation. Despite overlapping interests there is relatively little interaction and cross-fertilisation between these two lines of research. We would like here to show which precise methodology can be implemented while analyzing heterogeneous and multilingual corpora, drawing on these two lines of research. We are looking both at synchronic variation and change and at codeswitching and codemixing phenomena
Le domaine de la linguistique de contact est en pleine expansion depuis une quinzaine d'années mais fragmenté en plusieurs traditions de recherche et en particulier en deux traditions, l'une diachronique, l'autre synchronique. Peu de travaux tentent de tenir compte des avancées de ces deux traditions de recherche. Nous voudrions ici montrer quelle méthodologie précise, dans l'analyse minutieuse des corpus, peut être mise en œuvre afin de prendre en compte à la fois les phénomènes synchroniques (de variation et mélanges de langues) et diachroniques (de changement) et quelles questions épistémologiques se posent dans le traitement des données. Nous nous appuyons sur la méthodologie mise en place dans le projet CLAPOTY qui - à travers la réalisation d'une base de données plurilingues (170 enregistrements spontanés à ce jour correspondant à 290 locuteurs employant 40 langues typologiquement variées) - interroge les outils de la linguistique de corpus et propose d'annoter sous xml un nombre important de phénomènes (morphosyntaxiques et interactionnels) traités grâce aux catégorisations et typologies existantes en linguistique de contact. Nous présentons les méthodes d'annotation, de repérage et d'analyse mises en place afin de pouvoir proposer des explications plurifactorielles au contact de langues.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...