Des représentations continues de mots pour l'analyse d'opinions en arabe: une étude qualitative - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Des représentations continues de mots pour l'analyse d'opinions en arabe: une étude qualitative

Résumé

Word embeddings for Arabic sentiment analysis : a qualitative study In this paper, we are interested in Arabic sentiment analysis task. Recently, the use of deep learning improves many automatic systems in a wide variety of fields (image analysis, speech recognition, machine translation,. . .), among others English sentiment analysis. Thus, we study the performance of two architectures (CNN and LSTM) in our specific framework. In addition, we investigated the use of several types of word embeddings publically available for Arabic, that achieve good results. Finally, the analysis of the errors of our system and the relevance of the different embeddings was also proposed. These analysis lead to several interesting perspectives : building expert resources (lexicon) and relevant task-specific embeddings.
Nous nous intéressons, dans cet article, à la détection d'opinions dans la langue arabe. Ces dernières années, l'utilisation de l'apprentissage profond a amélioré des performances de nombreux systèmes automatiques dans une grande variété de domaines (analyse d'images, reconnaissance de la parole, traduction automatique,. . .) et également celui de l'analyse d'opinions en anglais. Ainsi, nous avons étudié l'apport de deux architectures (CNN et LSTM) dans notre cadre spécifique. Nous avons également testé et comparé plusieurs types de représentations continues de mots (embeddings) disponibles en langue arabe, qui ont permis d'obtenir de bons résultats. Nous avons analysé les erreurs de notre système et la pertinence de ces embeddings. Cette analyse mène à plusieurs perspectives intéressantes de travail, au sujet notamment de la constitution automatique de ressources expert et d'une construction pertinente des embeddings spécifiques à la tâche d'analyse d'opinions
Fichier principal
Vignette du fichier
Des_repr_sentations_continues_de_mots_pour_l_analyse_d_opinions_en_arabe___une__tude_qualitative-3.pdf (252.48 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01757776 , version 1 (26-02-2019)
hal-01757776 , version 2 (06-03-2019)

Identifiants

  • HAL Id : hal-01757776 , version 2

Citer

Amira Barhoumi, Nathalie Camelin, Yannick Estève. Des représentations continues de mots pour l'analyse d'opinions en arabe: une étude qualitative. 25e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2018), May 2018, Rennes, France. ⟨hal-01757776v2⟩
343 Consultations
245 Téléchargements

Partager

Gmail Facebook X LinkedIn More