Discourse on climate and energy justice: a comparative study of Do It Yourself and Bootstrapped corpora - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Corpus Année : 2018

Discourse on climate and energy justice: a comparative study of Do It Yourself and Bootstrapped corpora

Résumé

This article offers a descriptive and analytic view of the different stages leading to the constitution of a corpus that is representative of the issues of climate and energy justice. Overall, the corpus contains over five million words and gathers reports, newsletters and web-pages dealing with the most equitable ways of moving to a low-carbon future in the aim of limiting climate change. It can be divided into six sub-corpora, according to types of discourse communities, and methods of constitution. We begin by presenting the small Do It Yourself (DIY) corpora which were used as a starting point. Three discourse communities were selected to observe possible variation in their treatment of the issue: Non-Governmental Organisations (NGOs), United-Nation institutions, and the Renewable Energy Sector (RES). The sources are selected according to author, date, keywords in title. Using the concordance Antconc and WMatrix software we test the reliability of the corpora for their thematic content, terminology and lexical unit classification. Our first results enable us to confirm variation between the discourse communities. The discrepancy in sizes and the time-consuming nature of the initial DIY corpus constitution lead us to use BootCat to extend them, using keywords from the corpora as seeds to retrieve and download webpages. We thus contrast a more traditional approach to corpus building to web-as-corpus data gathering methods. We compare the results found in the BootCat corpora to test if they are as specific as those in the DIY corpora. This enables us to draw conclusions on the possible uses and advantages of relatively small corpora for the study of specialised discourse.
Cet article décrit et analyse les différentes étapes de constitution d’un corpus représentatif des questions de justice climatique et énergétique. Le corpus contient cinq millions de mots en tout et rassemble des rapports, des lettres d’information et pages web traitant des solutions équitables à faible empreinte carbone pour limiter le changement climatique. Il est divisé en six sous-corpus selon les types de communautés de discours et de méthodes de constitution. Nous commençons par la présentation du petit corpus fait maison que nous utilisons comme point de départ. Trois communautés de discours ont été sélectionnées afin d’observer d’éventuelles variations dans leur traitement de ces questions : Organisations Non Gouvernementales, institutions onusiennes et organisations du secteur de l’énergie renouvelable. Les sources ont été sélectionnées en fonction des auteurs, dates et mots clés présents dans les titres. Grâce aux logiciels de concordance AntConc et WMatrix, nous avons testé la comparabilité de ces corpus du point de vue de leur contenu thématique, de leur terminologie et de la classification de leurs unités lexicales. Nos premiers résultats nous permettent de confirmer l’existence de variations entre communautés de discours. Le caractère chronophage de notre démarche de constitution d’un corpus « maison », ainsi que le déséquilibre entre le nombre de mots obtenus pour chaque sous-corpus nous conduisent à utiliser BootCat afin de constituer un corpus plus fourni. L’outil utilise des mots clés comme « semences » pour la récupération et le téléchargement automatiques de pages web. Nous pouvons ainsi comparer une méthodologie traditionnelle de constitution de corpus à une méthodologie qui utilise le web en tant que corpus. Nos résultats BootCat sont confrontés à ceux du corpus maison pour voir s’ils révèlent aussi bien les spécificités des sous-corpus. Cette démarche aboutit à des conclusions sur les possibles utilisations de corpus relativement petits, et d’en souligner la pertinence pour l’étude de discours spécialisés.
Fichier principal
Vignette du fichier
corpus-3376.pdf (2.97 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-01894686 , version 1 (12-10-2018)

Identifiants

Citer

Camille Biros, Caroline Rossi, Inesa Sahakyan. Discourse on climate and energy justice: a comparative study of Do It Yourself and Bootstrapped corpora. Corpus, 2018, 18, ⟨10.4000/corpus.3376⟩. ⟨halshs-01894686⟩
99 Consultations
216 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More