Un modèle de partition du vocabulaire - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 1988

Un modèle de partition du vocabulaire

Résumé

The model proposed here is used to describe the vocabulary of a corpus. It is divided into two groups : general vocabulary which is used whatever the circumstances and several local (or 'specialised') vocabularies, each of which is used in only one part of the corpus, General words may appear everywhere in the text and their increase with corpus size can be estimated with Muller's formula. In this model, a partition parameter measures the relative importance of both types of vocabularies: so the value of this parameter gives an estimation of the lexical 'specialisation' in the text. This model has been applied to Racine's plays and TV debates (Giscard vs Mitterrand, Chirac vs Fabius). The partition model can also be used to measure the increase of vocabulary with corpus length, to locate stylistic changes or to compare several texts from the point of view of their lexical richness.
On propose ici un modèle de description du vocabulaire employé dans un corpus ; il est partagé en deux groupes : un vocabulaire général employé quelles que soient les circonstances et des vocabulaires locaux (ou "spécialisés") dont chacun est mobilisé dans une partie seulement du corpus. Les vocables généraux peuvent apparaître en n'importe quel point du texte et leur accroissement, en fonction de la taille du corpus, peut être estimé grâce à la formule de Muller. Dans le modèle, un paramètre de partition estime le poids relatif des deux vocabulaires : la valeur de ce paramètre donne donc une estimation de la spécialisation lexicale à l'œuvre dans le corpus. Des applications de ce modèle sont conduites sur l'œuvre de Racine et sur des débats télévisés (Giscard-Mitterrand et Chirac-Fabius), Le modèle de partition peut être également utilisé pour calculer l'accroissement du vocabulaire dans un corpus, pour y localiser des variations stylistiques ou pour comparer pusieurs textes du point de vue de leur "richesse de vocabulaire".
Fichier principal
Vignette du fichier
HubertLabbA_1998b.pdf (225.63 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00758061 , version 1 (28-11-2012)

Identifiants

  • HAL Id : hal-00758061 , version 1

Citer

Pierre Hubert, Dominique Labbé. Un modèle de partition du vocabulaire. Dominique Labbé, Philippe Thoiron, Daniel Serant. Etudes sur la richesse et la structures lexicales, Slatkine-Champion, pp.93-114, 1988. ⟨hal-00758061⟩
388 Consultations
462 Téléchargements

Partager

Gmail Facebook X LinkedIn More