Approches Statistique et Linguistique Pour la Classification de Textes d'Opinion Portant sur les Films

Damien Poirier 1, 2 Françoise Fessant 1 Cécile Bothorel 3 Emilie Guimier de Neef 1 Marc Boullé 1
3 Lab-STICC_TB_CID_DECIDE
Lab-STICC - Laboratoire des sciences et techniques de l'information, de la communication et de la connaissance
Résumé : Les sites communautaires sont par nature des lieux consacrés à l'expression et au partage d'avis et d'opinions. www.flixster.com est un exemple de site participatif où se retrouvent chaque jour des dizaines de millions de fans dans le but de partager leurs impressions et sentiments sur les films. Une étude approfondie de cette richesse d'information permettrait une meilleure connaissance des utilisateurs, de leurs attentes, de leurs besoins. Pour y parvenir, une étape nécessaire est la classification automatique d'opinion.Dans ce papier nous décrivons trois approches permettant de classer des textes selon l'opinion qu'ils expriment. La première approche consiste à étiqueter lesmots porteurs d'opinion à l'aide de techniques linguistiques, ces mots permettant par la suite de classer les textes. La deuxième approche est basée sur des techniques statistiques. La dernière approche est une approche hybride qui combine approche linguistique, pour prétraiter le corpus, et approche statistique, afin de classer les textes.
Type de document :
Article dans une revue
Revue des Nouvelles Technologies de l'Information, Hermann, 2009, RNTI-E-17, pp.Pages 147-169
Liste complète des métadonnées

Littérature citée [37 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00466412
Contributeur : Damien Poirier <>
Soumis le : mardi 23 mars 2010 - 16:48:20
Dernière modification le : jeudi 7 février 2019 - 16:20:42
Document(s) archivé(s) le : vendredi 25 juin 2010 - 12:05:05

Fichier

rnti09-poirier_et_al.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00466412, version 1

Citation

Damien Poirier, Françoise Fessant, Cécile Bothorel, Emilie Guimier de Neef, Marc Boullé. Approches Statistique et Linguistique Pour la Classification de Textes d'Opinion Portant sur les Films. Revue des Nouvelles Technologies de l'Information, Hermann, 2009, RNTI-E-17, pp.Pages 147-169. 〈hal-00466412〉

Partager

Métriques

Consultations de la notice

923

Téléchargements de fichiers

2259