Faut-il prendre en compte la composition grammaticale des textes dans le calcul des spécificités lexicales ? Tests logométriques appliqués au discours présidentiel sous la Vème République - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2006

Faut-il prendre en compte la composition grammaticale des textes dans le calcul des spécificités lexicales ? Tests logométriques appliqués au discours présidentiel sous la Vème République

Résumé

Do we need to weight lexical specificities by the grammatical composition of texts ? Logometrical tests applied to the presidential discours under the 5th republic For several years, textual statistics successively applied to untreated texts and then to the same lemmatized grammaticalized texts, has given global or identically synthetic results. Great textual classifications leading to more or less innovative textual typologies appear insensible to the linguistic unit processed (form or lemma, grammatical category or syntactic combination). Thus on an AFC for example, a given discourse standing out from others from a lexical viewpoint, will also stand out grammatically. Moreover, in this logic, the study of lexical specificities and then the study of grammatical specificities appear redundant more often than not, it is as if the same thing was measured twice. What is at stake in this contribution is to manage to establish a relation between two intrinsically related linguistic events (the lexical event and the grammatical one) and to cast light - or in statistics terms to weight- one with the other. So far the statistic probability to see such and such word appear has always been calculated in relation to the total set of forms, even if it is informed not by the total surface of the corpus and its sub-parts, but by the proportion of the grammatical category corresponding to that of the word in the corpus and its sub-parts.
Depuis plusieurs années, la statistique textuelle appliquée successivement à des corpus de textes bruts puis aux mêmes textes lemmatisés/grammaticalisés donne des résultats globaux ou synthétiques identiques. Les grandes classifications de textes, qui aboutissent à des typologies textuelles plus ou moins innovantes, apparaissent insensibles à l'unité linguistique traitée (forme ou lemme, catégorie grammaticale et enchaînement syntaxique). Ainsi sur une AFC par exemple, un discours qui se distingue des autres d'un point de vue lexical s'en distinguera de manière similaire d'un point de vue grammatical. L'enjeu de cette contribution est de réussir à mettre en relation deux événements linguistiques intimement liés (l'événement lexical et l'événement grammatical) et d'éclairer –c'est-à-dire en terme statistique, sans doute, de pondérer– l'un par l'autre. Jusqu'ici, la probabilité statistique de voir apparaître tel mot a toujours été calculée par rapport à l'ensemble des mots du corpus, quand bien même cette probabilité est informée, non par la surface totale du corpus, mais par la proportion de la catégorie grammaticale dont les mots relèvent.
Fichier principal
Vignette du fichier
23_Mayaffre_JADT_2006.pdf (2.04 Mo) Télécharger le fichier
Origine : Accord explicite pour ce dépôt

Dates et versions

hal-00554681 , version 1 (11-01-2011)

Identifiants

  • HAL Id : hal-00554681 , version 1

Citer

Damon Mayaffre. Faut-il prendre en compte la composition grammaticale des textes dans le calcul des spécificités lexicales ? Tests logométriques appliqués au discours présidentiel sous la Vème République. JADT 2006, Université de Franche-Comté, Apr 2006, Besançon, France. pp.677-685. ⟨hal-00554681⟩
125 Consultations
72 Téléchargements

Partager

Gmail Facebook X LinkedIn More