Fouille de textes pour une analyse comparée de l’information diffusée par les médias en ligne : une étude sur trois éditions du Huffington Post

Résumé : Cet article présente un processus d'analyse mis en place dans le cadre d'une collaboration entre des chercheurs en informatique, en sociologie et en sciences de l'information et de la communication, à l'occasion du projet Journalisme A l'heure Du Numérique. Le processus consiste pour le moment en un recodage manuel de thématiques extraites de manière totalement non supervisée à partir des données textuelles publiées sur le site du Huffington Post. Cette démarche rend possible une analyse comparée d'un corpus d'articles publiés durant l'été 2016 dans trois éditions différentes du journal (française, américaine, brésilienne). Les premiers résultats présentés permettent de valider la démarche tout en interrogeant sur les améliorations possibles, en particulier une automatisation plus importante des étapes qui composent le processus.
Complete list of metadatas

Cited literature [31 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01571265
Contributor : Frédéric Aubrun <>
Submitted on : Tuesday, August 1, 2017 - 11:58:17 PM
Last modification on : Wednesday, November 20, 2019 - 2:45:34 AM

File

EGC_2017_paper_154.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01571265, version 1

Citation

Julien Velcin, Jean-Claude Soulages, Solange Kurpiel, Luis Dias, Myrian del Vecchio, et al.. Fouille de textes pour une analyse comparée de l’information diffusée par les médias en ligne : une étude sur trois éditions du Huffington Post. Extraction et Gestion des Connaissances (EGC), Jan 2017, Grenoble, France. ⟨hal-01571265⟩

Share

Metrics

Record views

321

Files downloads

230