Le Thesaurus Occitan : entre atlas et dictionnaire - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Corpus Année : 2013

Le Thesaurus Occitan : entre atlas et dictionnaire

Résumé

: Too few scholars are dedicated to Occitan studies. There are a lot of reasons for such a situation, among which the social and political status of the language is not the least. Occitan studies also are affected by a split in the research attitudes and conceptions. Specifically, there is no regular continuity between works describing dialectal varieties and works contributing to corpus planning, even when the former ones don't undervalue the language status and the latter ones don't ignore dialect complexity. We shall not try here to analyse the reasons for this difficult cooperation. We only want make it clear, on the basis of a few examples, that the orthographic codification of Occitan not only has a practical relevance (allowing to write, use and teach the language), but also is a valuable scientific and descriptive tool . In order to do so, we shall first explain the principles of the so-called "classical" Occitan orthography and we shall then indicate how lemmatizing on the basis of this notation strongly helps organize, from inside the language, the huge wealth of lexical and morphological data included in Thesaurus Occitan (THESOC, cf. Dalbera 1998 and for an online sample : http://thesaurus.unice.fr/).
Les études occitanes souffrent d'un manque de chercheurs. Les causes en sont multiples et ne sont pas étrangères au statut social et politique de la langue. Les études occitanes souffrent de plus d'une segmentation des pratiques et des réflexions. Spécifiquement, la circulation n'est pas facile entre la description des variétés dialectales de l'occitan (même pénétrée de la dignité de la langue) et la codification (même bien informée de la réalité dialectale). Notre propos n'est pas ici d'analyser les raisons de ces dysfonctionnements, mais de montrer par l'exemple que la codification graphique de l'occitan a une utilité scientifique et descriptive, en plus de sa pertinence pratique première (écrire, utiliser et enseigner la langue) . Pour ce faire, nous présenterons ici la logique de la codification graphique dite " classique " de l'occitan avant de montrer comment une lemmatisation fondée sur cette graphie est un précieux instrument d'organisation interne de la masse de données lexicales et morphologiques occitanes que constitue le Thesaurus Occitan (THESOC, cf. Dalbera 1998 et pour la partie en ligne : http://thesaurus.unice.fr/).

Domaines

Linguistique
Fichier principal
Vignette du fichier
2013_Corpus_Sauzet_Brun-Trigaud.pdf (693.25 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00990186 , version 1 (13-05-2014)

Identifiants

  • HAL Id : hal-00990186 , version 1

Citer

Patrick Sauzet, Guylaine Brun-Trigaud. Le Thesaurus Occitan : entre atlas et dictionnaire. Corpus, 2013, 12, pp.105-140. ⟨hal-00990186⟩
294 Consultations
286 Téléchargements

Partager

Gmail Facebook X LinkedIn More