Annotation d’expressions polylexicales verbales en français

Résumé : Nous décrivons la partie française des données produites dans le cadre de la campagne multilingue PARSEME sur l’identification d’expressions polylexicales verbales (Savary et al., 2017). Les expressions couvertes pour le français sont les expressions verbales idiomatiques, les verbes intrinsèquement pronominaux et une généralisation des constructions à verbe support. Ces phénomènes ont été annotés sur le corpus French-UD (Nivre et al., 2016) et le corpus Sequoia (Candito & Seddah, 2012), soit un corpus de 22 645 phrases, pour un total de 4 962 expressions annotées. On obtient un ratio d’une expression annotée tous les 100 tokens environ, avec un fort taux d’expressions discontinues (40%).
Type de document :
Communication dans un congrès
Iris Eshkol, Jean-Yves Antoine. 24e conférence sur le Traitement Automatique des Langues Naturelles (TALN), Jun 2017, Orléans, France. pp.1-9, Actes de TALN, volume 2 : articles courts. 〈http://taln2017.cnrs.fr〉
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01537880
Contributeur : Yannick Parmentier <>
Soumis le : vendredi 16 juin 2017 - 09:49:45
Dernière modification le : mardi 5 juin 2018 - 10:10:03
Document(s) archivé(s) le : mercredi 13 décembre 2017 - 13:09:54

Fichier

taln17-parseme-st-frenchdata-f...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01537880, version 1

Citation

Marie Candito, Mathieu Constant, Carlos Ramisch, Agata Savary, Yannick Parmentier, et al.. Annotation d’expressions polylexicales verbales en français. Iris Eshkol, Jean-Yves Antoine. 24e conférence sur le Traitement Automatique des Langues Naturelles (TALN), Jun 2017, Orléans, France. pp.1-9, Actes de TALN, volume 2 : articles courts. 〈http://taln2017.cnrs.fr〉. 〈hal-01537880〉

Partager

Métriques

Consultations de la notice

351

Téléchargements de fichiers

115