Apprentissage non supervisé de dépendances syntaxiques à partir de texte étiqueté, plusieurs variantes de PCFG légères

Résumé : L’apprentissage de dépendances est une tâche consistant à établir, à partir des phrases d’un texte, un modèle de construction d’arbres traduisant une hiérarchie syntaxique entre les mots. Nous proposons un modèle intermédiaire entre l’analyse syntaxique complète de la phrase et les sacs de mots. Il est basé sur une grammaire stochastique hors-contexte se traduisant par des relations de dépendance entre les catégories grammaticales d’une phrase. Les résultats expérimentaux obtenus sur des benchmarks attestés dépassent pour cinq langues sur dix les scores de l’algorithme de référence DMV, et pour la première fois des scores sont obtenus pour le français. La très grande simplicité de la grammaire permet un apprentissage très rapide, et une analyse presque instantanée.
Type de document :
Communication dans un congrès
Revue des Nouvelles Technologies de l'Information (RNTI). Extraction et Gestion des Connaissances (EGC), Jan 2014, Rennes, France. Hermann, pp.155-160, 2014
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-00978272
Contributeur : Guillaume Cleuziou <>
Soumis le : lundi 14 avril 2014 - 08:18:58
Dernière modification le : mardi 5 février 2019 - 12:12:40

Identifiants

  • HAL Id : hal-00978272, version 1

Citation

Marie Arcadias, Guillaume Cleuziou, Edmond Lassalle, Christel Vrain. Apprentissage non supervisé de dépendances syntaxiques à partir de texte étiqueté, plusieurs variantes de PCFG légères. Revue des Nouvelles Technologies de l'Information (RNTI). Extraction et Gestion des Connaissances (EGC), Jan 2014, Rennes, France. Hermann, pp.155-160, 2014. 〈hal-00978272〉

Partager

Métriques

Consultations de la notice

321