Analyse automatique FrameNet : une étude sur un corpus français de textes encyclopédiques

Résumé : Cet article présente un système d'analyse automatique en cadres sémantiques évalué sur un corpus de textes encyclopédiques d'histoire annotés selon le formalisme FrameNet. L'approche choisie repose sur un modèle intégré d'étiquetage de séquence qui optimise conjointement l'identification des cadres, la segmentation et l'identification des rôles sémantiques associés. Nous cherchons dans cette étude à analyser la complexité de la tâche selon plusieurs dimensions. Une analyse détaillée des performances du système est ainsi proposée, à la fois selon l'angle des paramètres du modèle et de la nature des données. ABSTRACT FrameNet automatic analysis : a study on a French corpus of encyclopedic texts This article presents an automatic frame analysis system evaluated on a corpus of French encyclopedic history texts annotated according to the FrameNet formalism. The chosen approach relies on an integrated sequence labeling model which jointly optimises frame identification and semantic role segmentation and identification. The purpose of this study is to analyze the task complexity from several dimensions. Hence we provide detailed evaluations from a feature selection point of view and from the data point of view. MOTS-CLÉS : Analyse en cadres sémantiques, étiquetage de séquence, textes encyclopédiques.
Type de document :
Communication dans un congrès
TALN 2017, 2017, Orléans, France
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01959260
Contributeur : Gabriel Marzinotto <>
Soumis le : mardi 18 décembre 2018 - 15:43:35
Dernière modification le : jeudi 20 décembre 2018 - 16:10:03

Fichiers

analyse-automatique-framenet(2...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01959260, version 1
  • ARXIV : 1812.08044

Collections

Citation

Gabriel Marzinotto, Géraldine Damnati, Frederic Bechet. Analyse automatique FrameNet : une étude sur un corpus français de textes encyclopédiques. TALN 2017, 2017, Orléans, France. 〈hal-01959260〉

Partager

Métriques

Consultations de la notice

32

Téléchargements de fichiers

5