L'exploitation des grands corpus: Le bestiaire de la litterature francaise - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Literary and Linguistic Computing Année : 1989

L'exploitation des grands corpus: Le bestiaire de la litterature francaise

Résumé

Les méthodes statistiques, qui sont toujours comparatives, permettent de comparer les uns aux autres des mots, des textes et plus précisément l’usage différencié des mots dans les textes. Les données de base prennent alors la forme d’un tableau à deux dimensions, où la cellule (i,j) contient la fréquence du mot i dans le texte j. Il suffit donc de choisir les mots (les lignes du tableau) et les textes ou ensembles de textes (les colonnes). Le logiciel STELLA, créé par Jacques Dendien pour l'exploration de FRANTEXT, permet très aisément de dresser la liste des premiers et des seconds , avant que la commande frequence ne soit lancée qui met en rapport les deux listes et établit le tableau à exploiter. Nous choisirons à titre de démonstration un cas facile et même trivial, où le doute n’est guère permis. Et nous nous proposerons de vérifier si Colette aime les chats et plus largement les bêtes, ou du moins si son vocabulaire, par quelque intempérance lexicale, porte témoignage de cet amour . Et fort de ce premier essai, nous étendrons l'enquête à l'ensemble des écrivains pour établir le bestiaire de la littérature française.
Fichier principal
Vignette du fichier
13BAT_Bestiaire3.pdf (1.76 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01574221 , version 1 (12-08-2017)

Identifiants

Citer

Étienne Brunet. L'exploitation des grands corpus: Le bestiaire de la litterature francaise. Literary and Linguistic Computing, 1989, 4 (1), pp.121-134. ⟨10.1093/llc/4.2.121⟩. ⟨hal-01574221⟩
132 Consultations
710 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More