Le corpus Polititweets : enjeux institutionnels, juridiques, techniques et philologiques - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 2017

Le corpus Polititweets : enjeux institutionnels, juridiques, techniques et philologiques

Julien Longhi

Résumé

L'analyse du discours politique connaît un renouvellement important, dû notamment aux nouveaux supports et formats d'expression, comme les réseaux sociaux numériques (RSN). Or, ces lieux de production d'écrits sont le plus souvent saisis par des disciplines qui les traitent comme des données sociales, plutôt que comme des discours. Cet article vise à décrire les enjeux philologiques, herméneutiques, et également institutionnels et interdisciplinaires, de la constitution d'un corpus de tweets politiques. Le corpus Polititweets (Longhi et al. 2014 : 34273 messages, 205 utilisateurs) a été élaboré selon le format TEI (avec des pistes d'extension aux formats CMC proposées par un groupe européen qui s'est constitué autour de cette question), afin de tenir compte des éléments spatio-temporels, contextuels, technologiques, interactionnels, thématiques, dialogiques, etc. des messages produits. Il s'agit donc dans un premier temps de décrire le contexte d'élaboration du corpus, la méthodologie et des considérations juridiques. Dans un second temps, nous détaillons les enjeux philologiques de la constitution du corpus, en explicitant les critères qui ont présidé à sa structuration, pour passer d'une base de données à un corpus au format TEI. Dans un dernier temps, nous décrivons la démarche de mise à disposition du corpus et les questions d'« open access ».

Mots clés

Domaines

Linguistique
Fichier principal
Vignette du fichier
article Longhi IRD 2.pdf (562.8 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01270984 , version 1 (08-02-2016)
hal-01270984 , version 2 (18-07-2016)

Identifiants

  • HAL Id : hal-01270984 , version 2

Citer

Julien Longhi. Le corpus Polititweets : enjeux institutionnels, juridiques, techniques et philologiques. Ciara Wigham et Gudrun Ledegen. Corpus de communication médiée par les réseaux : construction, structuration, analyse, Harmattan 2017. ⟨hal-01270984v2⟩

Collections

UNIV-CERGY
482 Consultations
644 Téléchargements

Partager

Gmail Facebook X LinkedIn More