Le traitement des TICE dans les discours politiques et dans la presse - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Le traitement des TICE dans les discours politiques et dans la presse

Résumé

The very existence of databases in addition to the ability to scan press materiel now allows researchers to access very large corpuses. However the availability of these databases and their number in constant evolution raise the problem of the thematic relevance of the selected articles. This study proposes to handle two corpus by using the software Iramuteq (P. Ratinaud, Lerass, University of Toulouse). By the means of the descendant hierarchical clustering, following to the Reinert method, we will examine the themes developed throughout the corpus, in order to extract the segment of texts for our topic. The sub-corpus obtained in this manner will then allow to identify, via a similarity analysis, the organization of the discourse in the targeted thematic. Résumé La numérisation des documents de presse et l'existence de base de données permettent aujourd'hui aux chercheurs d'accéder à des corpus de plus en plus grands. Cependant la facilité d'accès à ces données et leur nombre en constante évolution posent le problème de la pertinence thématique des articles sélectionnés. Nous proposons ici une étude sur la manipulation de deux corpus à l'aide du logiciel Iramuteq (P. Ratinaud, Lerass, Université de Toulouse). La Classification Hiérarchique Descendante (CHD), selon la méthode Reinert, nous permettra d'étudier les thèmes développés dans l'ensemble des corpus, afin d'extraire les segments de texte ciblant notre sujet. Les analyses menées sur les sous-corpus obtenus permettront alors d'identifier l'organisation des discours sur la thématique ciblée.
La numérisation des documents de presse et l’existence de base de données permettent aujourd'hui aux chercheurs d'accéder à des corpus de plus en plus grands. Cependant la facilité d'accès à ces données et leur nombre en constante évolution posent le problème de la pertinence thématique des articles sélectionnés. Nous proposons ici une étude sur la manipulation de deux corpus à l'aide du logiciel Iramuteq (P.Ratinaud, Lerass, Université de Toulouse). La Classification Hiérarchique Descendante (CHD),selon la méthode Reinert, nous permettra d'étudier les thèmes développés dans l'ensemble des corpus, afin d'extraire les segments de texte ciblant notre sujet. Les analyses menées sur les sous-corpus obtenus permettront alors d'identifier l'organisation des discours sur la thématique ciblée
Fichier principal
Vignette du fichier
36-JADT2014.pdf (654.09 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02482574 , version 1 (18-02-2020)

Identifiants

  • HAL Id : hal-02482574 , version 1

Citer

Lucie Loubère. Le traitement des TICE dans les discours politiques et dans la presse. Journées internationales d’Analyse statistique des Données Textuelles., 2014, Paris, France. ⟨hal-02482574⟩
264 Consultations
104 Téléchargements

Partager

Gmail Facebook X LinkedIn More