Wikiconflits, un corpus extrait de Wikipédia : principe et méthode d'élaboration

Résumé : Le groupe CoMeRe-nouvelles-acquisitions-Wikipédia a constitué un corpus de pages Wikipédia, le corpus Wikiconflits (https://repository.ortolang.fr/api/content/comere/v2/cmr-wikiconflits.html) qui a été adjoint au corpus CoMeRe afin d’améliorer sa représentativité. Son choix s’est porté autour de l'observation de pages ayant suscité des discussions conflictuelles autour de controverses dans les champs des sciences et des techniques. Dans une première partie, le groupe explique sa méthode de sélection des discussions conflictuelles. Dans les parties suivantes, le groupe CoMeRe-LRL expose la méthode de constitution du corpus en fonction des critères précédemment retenus et la façon de les transformer en TEI. Ce rapport se termine par la présentation de l'outil WikiTool développé lors des traitements. Mis à disposition sous licence libre il permet d'extraire des pages dans les fichiers de type Dump de Wikipedia.
Keywords : Corpuses
Type de document :
Rapport
[Rapport Technique] LRL, Clermont Ferrand, BCL, Nice. 2014
Liste complète des métadonnées

Littérature citée [17 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01288038
Contributeur : Céline Poudat <>
Soumis le : lundi 14 mars 2016 - 15:05:04
Dernière modification le : jeudi 3 mai 2018 - 12:52:02
Document(s) archivé(s) le : mercredi 15 juin 2016 - 14:01:49

Fichier

cmr-wikiconflits-tei-v4-manuel...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01288038, version 1

Collections

Citation

Céline Poudat, Jin Kun, Thierry Chanier. Wikiconflits, un corpus extrait de Wikipédia : principe et méthode d'élaboration. [Rapport Technique] LRL, Clermont Ferrand, BCL, Nice. 2014. 〈hal-01288038〉

Partager

Métriques

Consultations de la notice

225

Téléchargements de fichiers

177