2941 articles  [english version]
HAL : hal-00466412, version 1

Fiche détaillée  Récupérer au format
Revue des Nouvelles Technologies de l'Information RNTI-E-17 (2009) Pages 147-169
Approches Statistique et Linguistique Pour la Classification de Textes d'Opinion Portant sur les Films
Damien Poirier 1, 2, 3, Françoise Fessant 1, Cécile Bothorel 1, Emilie Guimier De Neef 1, Marc Boullé 1
(01/11/2009)

Les sites communautaires sont par nature des lieux consacrés à l'expression et au partage d'avis et d'opinions. www.flixster.com est un exemple de site participatif où se retrouvent chaque jour des dizaines de millions de fans dans le but de partager leurs impressions et sentiments sur les films. Une étude approfondie de cette richesse d'information permettrait une meilleure connaissance des utilisateurs, de leurs attentes, de leurs besoins. Pour y parvenir, une étape nécessaire est la classification automatique d'opinion.Dans ce papier nous décrivons trois approches permettant de classer des textes selon l'opinion qu'ils expriment. La première approche consiste à étiqueter lesmots porteurs d'opinion à l'aide de techniques linguistiques, ces mots permettant par la suite de classer les textes. La deuxième approche est basée sur des techniques statistiques. La dernière approche est une approche hybride qui combine approche linguistique, pour prétraiter le corpus, et approche statistique, afin de classer les textes.
1 :  Orange Labs - Lannion
France Télécom
2 :  Laboratoire d'Informatique Fondamentale d'Orléans (LIFO)
Université d'Orléans : EA4022 – Ecole Nationale Supérieure d'Ingénieurs de Bourges
3 :  Laboratoire d'Informatique de Paris 6 (LIP6)
CNRS : UMR7606 – Université Pierre et Marie Curie [UPMC] - Paris VI
Informatique/Recherche d'information
Liste des fichiers attachés à ce document : 
PDF
rnti09-poirier_et_al.pdf(227.3 KB)