Identification Semi-Automatique de Mots-Germes pour l'Analyse de Sentiments et son Intensité - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Semi-Automatic of Germ-Words Identification for Sentiment Analysis and Intensity

Identification Semi-Automatique de Mots-Germes pour l'Analyse de Sentiments et son Intensité

Résumé

For the purpose of opinion exploring in tweets, this article presents a sentiment classification of tweets content. First, we present a method to identify new sentiment similarity seed words. These seed words are used for predicting sentiment intensity of other words and short phrases in co-occurrence. Then, for testing sentiment similarity, we use: Similarity Measures methods between words and cosine similarity measure between the word embedding representations (e.g. word2vec, GloVE). The experiments results highlight the importance of adapted for tweets seed words. In addition of the corpora size and its pre-treatement. As a conclusion, best results were achieved using cosine similarity measure between the word embedding representations.
Dans le but d'exploiter les opinions dans les tweets, cet article présente une classification à partir du sentiment contenu au sein des tweets. Nous présentons une méthode d'identifi-cation de nouveaux mots-germes. Ils sont utilisés pour la prédiction de l'intensité de sentiments des mots en co-occurrence avec ces mots-germes. Ensuite, le calcul de similarités entre sentiments est appliqué en utilisant: la mesure de la similarité entre deux mots et l'utilisation de plongement de mots (e.g. word2vec, GloVE) couplé à la mesure cosinus. Les résultats montrent l'importance de l'utilisation de mots-germes adaptés aux tweets, ainsi que la taille et le prétrai-tement de corpus. Pour conclure, nous avons obtenu les meilleurs résultats grâce à l'application de la méthode utilisant le plongement de mots couplée à la mesure cosinus. ABSTRACT. For the purpose of opinion exploring in tweets, this article presents a sentiment classification of tweets content. First, we present a method to identify new sentiment similarity seed words. These seed words are used for predicting sentiment intensity of other words and short phrases in co-occurrence. Then, for testing sentiment similarity, we use: Similarity Measures methods between words and cosine similarity measure between the word embedding representations (e.g. word2vec, GloVE). The experiments results highlight the importance of adapted for tweets seed words. In addition of the corpora size and its pre-treatement. As a conclusion, best results were achieved using cosine similarity measure between the word embedding representations. MOTS-CLÉS : Mots-germes, Twitter, Mesure de la Similarité, Plongement de mot, Word2vec, GloVe.
Fichier principal
Vignette du fichier
RJC_2017_AmalHtait.pdf (323.66 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01771644 , version 1 (19-04-2018)

Identifiants

  • HAL Id : hal-01771644 , version 1

Citer

Amal Htait, Sébastien Fournier, Patrice Bellot. Identification Semi-Automatique de Mots-Germes pour l'Analyse de Sentiments et son Intensité. CORIA, Mar 2017, Marseille, France. ⟨hal-01771644⟩
190 Consultations
121 Téléchargements

Partager

Gmail Facebook X LinkedIn More