L'apport des Entités Nommées pour la classification des opinions minoritaires

Résumé : La majeure partie des travaux en fouille d'opinion et en analyse de sentiment concerne le classement des opinions majoritaires. Les méthodes d'apprentissage supervisé à base de n-grammes sont souvent employées. Elles ont l'inconvénient d'avoir un biais en faveur des opinions majoritaires si on les utilise de manière classique. En fait la présence d'un terme particulier, fortement associé à la cible de l'opinion dans un document peut parfois suffire à faire basculer le classement de ce document dans la classe de ceux qui expriment une opinion majoritaire sur la cible. C'est un phénomène positif pour l'exactitude globale du classifieur, mais les documents exprimant des opinions minoritaires sont souvent mal classés. Ce point est un problème dans le cas où l'on s'intéresse à la détection des signaux faibles (détection de rumeur) ou pour l'anticipation de renversement de tendance. Nous proposons dans cet article d'améliorer la classification des opinions minoritaires en prenant en compte les Entités Nommées dans le calcul de pondération destiné à corriger le biais en faveur des opinions majoritaires. ABSTRACT Improving Minor Opinion Polarity Classification with Named Entity Analysis The main part of the work on opinion mining and sentiment analysis concerns polarity classification of majority opinions. Supervised machine learning with n-gram features is a common approach to polarity classification, which is often biased towards the majority of opinions about a given opinion target, when using this kind of approach with traditional settings. The presence of a specific term, strongly associated to the opinion target in a document, is often enough to tip the classifier decision toward the majority opinion class. This is actually a good thing for overall accuracy. Howeverm documents about the opinion taget, but expressing a polarity different from the majority one, get misclassified. It is a problem if we want to detect weak signals (rumor detection) or for anticipating opinion reversal trends. We propose in this paper to improve minor reviews polarity classification by taking into account Named Entity information in the computation of specific weighting scheme used for correcting the bias toward majority opinions.
Type de document :
Communication dans un congrès
In proceedings of the 20ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2013), Jun 2013, Les Sables d’Olonne, France
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01618423
Contributeur : Amel Fraisse <>
Soumis le : mardi 17 octobre 2017 - 21:07:27
Dernière modification le : mardi 20 novembre 2018 - 14:04:02
Document(s) archivé(s) le : jeudi 18 janvier 2018 - 14:51:19

Fichier

ucomp_ne_limsi.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01618423, version 1

Collections

Citation

Amel Fraisse, Patrick Paroubek, Gil Francopoulo. L'apport des Entités Nommées pour la classification des opinions minoritaires. In proceedings of the 20ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2013), Jun 2013, Les Sables d’Olonne, France. 〈hal-01618423〉

Partager

Métriques

Consultations de la notice

80

Téléchargements de fichiers

66