#AIDS Analyse Information Dangers Sexualité : caractériser les discours à propos du VIH dans les forums de santé

Résumé : Contexte : Les forums de discussion consacrés au VIH remplissent trois fonctions. Tout d'abord, ils sont utilisés par les internautes comme sources d'information pour se renseigner sur les traitements, les risques d'infection liés au sida ou le « vivre avec » la maladie ou le virus. Ensuite, ils servent de média pour les institutions de santé ou les associations afin de communiquer des informations de prévention sur le VIH. Enfin, ils apparaissent comme sources de connaissances pour les professionnels de santé (médecins, soignants) pour comprendre les comportements liés au VIH, et pour les professionnels de la prévention, pour modérer les forums et adapter les campagnes de prévention aux différents publics. Objectif : Notre objectif dans cet article est de proposer un processus d'ingénierie des connaissances com-plet, permettant : 1) de collecter des messages dans des médias sociaux ; 2) de classifier ces messages de manière semi-automatique selon le genre, le niveau d'expertise, le niveau informationnel, le type de risque ainsi que les émotions exprimées ; 3) de visualiser ces nouvelles connaissances dans une représentation ori-ginale prenant en compte la temporalité et la hiérarchie sous-jacente à la classification. Cette visualisation pourrait permettre aux gestionnaires de sites de forums et aux professionnels de santé de naviguer dans le flot de messages pour suivre l'évolution de l'importance de ces thématiques. Méthodes : Notre approche combine une démarche qualitative et quantitative. Nous avons travaillé sur plus de 226 252 messages issus du forum Sida Info Service. Deux chercheurs en sciences de l'information et de la communication ont élaboré une grille d'analyse, puis ont annoté 4 481 messages selon cette grille. Ces données ont été utilisées pour apprendre des classifieurs qui ont permis d'étiqueter l'ensemble des messages du site à notre disposition. Afin de définir les meilleurs classifieurs, nous avons comparé l'efficacité des mé-thodes de classification traditionnelles statistiques et plusieurs architectures d'apprentissage profond. Une fois les messages étiquetés, nous avons utilisé une visualisation de type streamgraph, combinée avec un outil de navigation hiérarchique, pour visualiser l'évolution de ces annotations dans le temps. Résultats : Les résultats sont prometteurs et montrent l'efficacité des méthodes d'apprentissage profond pour caractériser les messages des forums de manière automatique. La méthode de visualisation mise en place permet d'explorer les résultats de ces méthodes et ainsi faciliter l'accès aux connaissances.
Document type :
Conference papers
Complete list of metadatas

Cited literature [20 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01839552
Contributor : Sylvie Ranwez <>
Submitted on : Sunday, July 15, 2018 - 3:17:24 PM
Last modification on : Thursday, June 27, 2019 - 4:06:12 PM
Long-term archiving on : Tuesday, October 16, 2018 - 12:25:24 PM

File

actes_IC2018_MercadierEtAl.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01839552, version 1

Citation

Yves Mercadier, Jérôme Azé, Sandra Bringay, Viviane Clavier, Erick Cuenca, et al.. #AIDS Analyse Information Dangers Sexualité : caractériser les discours à propos du VIH dans les forums de santé. IC: Ingénierie des Connaissances, AFIA, Jul 2018, Nancy, France. pp.71-86. ⟨hal-01839552⟩

Share

Metrics

Record views

306

Files downloads

90