CANÉPHORE : un corpus français pour la fouille d'opinion ciblée - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

CANÉPHORE~: a French corpus for aspect-based sentiment analysis evaluation

CANÉPHORE : un corpus français pour la fouille d'opinion ciblée

Résumé

Aspect-based sentiment analysis knows a renewed interest these last years, according to recent opinion mining evaluation series (SemEval 2014 and 2015, DEFT 2015). However, publicly available evaluation resources are scarse. This work firstly introduces a publicly available annotated French Twitter corpus for sentiment analysis evaluation on aspect, subject and opinion word levels (10 000 documents). We present baseline results on this corpus for the task of opinion word extraction and then show that these results can be improved with simple semi-supervised methods.
La fouille d'opinion ciblée (aspect-based sentiment analysis) fait l'objet ces dernières années d'un inté-rêt particulier, visible dans les sujets des récentes campagnes d'évaluation comme SemEval 2014 et 2015 ou bien DEFT 2015. Cependant les corpus annotés et publiquement disponibles permettant l'évaluation de cette tâche sont rares. Dans ce travail nous présentons en premier lieu un corpus français librement accessible de 10 000 tweets manuellement annotés. Nous accompagnons ce corpus de résultats de référence pour l'extraction de marqueurs d'opinion non supervisée. Nous présentons ensuite une méthode améliorant les résultats de cette extraction, en suivant une approche semi-supervisée.
Fichier principal
Vignette du fichier
taln2015-jlark.pdf (225.9 Ko) Télécharger le fichier
taln2015-poster-jlark.pdf (562.06 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01169293 , version 1 (29-06-2015)

Identifiants

  • HAL Id : hal-01169293 , version 1

Citer

Joseph Lark, Emmanuel Morin, Sebastián Peña Saldarriaga. CANÉPHORE : un corpus français pour la fouille d'opinion ciblée. 22e conférence sur le Traitement Automatique des Langues Naturelles (TALN), Jun 2015, Caen, France. ⟨hal-01169293⟩
721 Consultations
893 Téléchargements

Partager

Gmail Facebook X LinkedIn More