Les corpus plurilingues, entre linguistique de corpus et linguistique de contact - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Faits de langues Année : 2013

Les corpus plurilingues, entre linguistique de corpus et linguistique de contact

Isabelle Léglise
Sophie Alby

Résumé

Contact linguistics is a thriving area of research. There are two broad lines of research. The first one, from a diachronic perspective, focuses on the description of the outcomes of contact and its impact on the languages involved. The other one takes a synchronic approach and explores the social and linguistic effects of on- going contact settings involving multilingualism and code alternation. Despite overlapping interests there is relatively little interaction and cross-fertilisation between these two lines of research. We would like here to show which precise methodology can be implemented while analyzing heterogeneous and multilingual corpora, drawing on these two lines of research. We are looking both at synchronic variation and change and at codeswitching and codemixing phenomena
Le domaine de la linguistique de contact est en pleine expansion depuis une quinzaine d'années mais fragmenté en plusieurs traditions de recherche et en particulier en deux traditions, l'une diachronique, l'autre synchronique. Peu de travaux tentent de tenir compte des avancées de ces deux traditions de recherche. Nous voudrions ici montrer quelle méthodologie précise, dans l'analyse minutieuse des corpus, peut être mise en œuvre afin de prendre en compte à la fois les phénomènes synchroniques (de variation et mélanges de langues) et diachroniques (de changement) et quelles questions épistémologiques se posent dans le traitement des données. Nous nous appuyons sur la méthodologie mise en place dans le projet CLAPOTY qui - à travers la réalisation d'une base de données plurilingues (170 enregistrements spontanés à ce jour correspondant à 290 locuteurs employant 40 langues typologiquement variées) - interroge les outils de la linguistique de corpus et propose d'annoter sous xml un nombre important de phénomènes (morphosyntaxiques et interactionnels) traités grâce aux catégorisations et typologies existantes en linguistique de contact. Nous présentons les méthodes d'annotation, de repérage et d'analyse mises en place afin de pouvoir proposer des explications plurifactorielles au contact de langues.
Fichier principal
Vignette du fichier
07-LA_glise_et_Alby.pdf (269.8 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00880453 , version 1 (06-11-2013)

Identifiants

  • HAL Id : hal-00880453 , version 1

Citer

Isabelle Léglise, Sophie Alby. Les corpus plurilingues, entre linguistique de corpus et linguistique de contact : Réflexions et méthodes issues du projet CLAPOTY. Faits de langues, 2013, 41, pp.95-122. ⟨hal-00880453⟩

Relations

562 Consultations
1269 Téléchargements

Partager

Gmail Facebook X LinkedIn More