Utilisation des réseaux de neurones récurrents pour la projection interlingue d'étiquettes morpho-syntaxiques à partir d'un corpus parallèle

Résumé : In this paper, we propose a method to automatically induce linguistic analysis tools for languages that have no labeled training data. This method is based on cross-language projection of linguistic annotations from parallel corpora. Our method does not assume any knowledge about foreign languages, making it applicable to a wide range of resource-poor languages. No word alignment information is needed in our approach. We use Recurrent Neural Networks (RNNs) as cross-lingual analysis tool. To illustrate the potential of our approach, we firstly investigate Part-Of-Speech (POS) tagging. Combined with a simple projection method (using word alignment information), it achieves performance comparable to the one of recently published approaches for cross-lingual projection. Mots-clés : Multilinguisme, transfert crosslingue, étiquetage morpho-syntaxique, réseaux de neurones récurrents.
Type de document :
Communication dans un congrès
TALN 2015, Jul 2015, Caen, France. Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles
Liste complète des métadonnées

Littérature citée [23 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01350115
Contributeur : Laurent Besacier <>
Soumis le : vendredi 29 juillet 2016 - 16:25:59
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03
Document(s) archivé(s) le : dimanche 30 octobre 2016 - 12:24:11

Fichier

taln-2015-court-032.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01350115, version 1

Citation

Othman Zennaki, Nasredine Semmar, Laurent Besacier. Utilisation des réseaux de neurones récurrents pour la projection interlingue d'étiquettes morpho-syntaxiques à partir d'un corpus parallèle. TALN 2015, Jul 2015, Caen, France. Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. 〈hal-01350115〉

Partager

Métriques

Consultations de la notice

217

Téléchargements de fichiers

400