Résumé : Nous nous intéressons, dans cet article, à la tâche d'analyse d'opinions en arabe. Nous étudions la spécificité de la langue arabe pour la détection de polarité. Nous nous focalisons ici sur les caractéristiques d'agglutination et de richesse morphologique de cette langue. Nous avons particulièrement étudié différentes représentations d'unité lexicale : token, lemme et light stemme. Nous avons construit et testé des espaces continus de ces différentes représentations lexicales. Nous avons mesuré l'apport de tels types de representations vectorielles dans notre cadre spécifique. Les performances du réseau CNN montrent un gain significatif de 2\% par rapport à l'état de l'art.
Amira Barhoumi, Nathalie Camelin, Chafik Aloulou, Yannick Estève, Lamia Hadrich Belguith. Plongements lexicaux spécifiques à la langue arabe : application à l'analyse d'opinions. 26e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2019), Jul 2019, Toulouse, France. pp.381-390. ⟨hal-02567780⟩