Lexicométrie : quels outils pour les sciences humaines et sociales ? - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Lexicométrie : quels outils pour les sciences humaines et sociales ?

Résumé

Lexicometry is the alliance of linguistics, mathematics and computer science. It processes large sets of texts (corpus), establishing their vocabulary, classifying the words types in terms of their frequency, their distribution, their grammatical categories. It establishes the contexts of a word type and the most frequent combinations in which it appears. These collocations are used to determine the meanings of the terms. Lexicometry also highlights the main themes of a corpus, its gender and style. It segments the corpus according to the main thematic and stylistic discontinuities. To obtain these results, some pre-processing is necessary: text labeling, correction and standardization of spellings, lemmatization. Then the text can be placed into an electronic library available to researchers.
La lexicométrie est l'alliance des sciences du langage, des statistiques et de l'informatique. Elle permet de traiter de vastes ensembles de textes (corpus), d'établir leur vocabulaire, de classer les vocables en fonction de leur fréquence, de leur répartition, de leurs catégories grammaticales. Elle établit les contextes d'emploi d'un vocable et les combinaisons les plus fréquentes dans lesquelles il entre, ce qui permet de déterminer le ou les sens de ce vocable. Elle retrouve les principaux thèmes présents dans un corpus, son genre et son style. Elle segmente ce corpus en fonction des ruptures thématiques ou stylistiques. Pour obtenir ces résultats, des traitements préalables sont nécessaires : balisage des textes, correction et standardisation orthographiques, étiquetage des mots. Le texte peut alors entrer dans une bibliothèque électronique à la disposition des chercheurs.
Fichier principal
Vignette du fichier
LabbeLabbePrintemps.pdf (140.01 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00834039 , version 1 (14-06-2013)

Identifiants

  • HAL Id : hal-00834039 , version 1

Citer

Cyril Labbé, Dominique Labbé. Lexicométrie : quels outils pour les sciences humaines et sociales ?. Usages de la lexicométrie en sociologie, Jun 2013, Guyancourt, France. ⟨hal-00834039⟩
866 Consultations
4348 Téléchargements

Partager

Gmail Facebook X LinkedIn More