Skip to Main content Skip to Navigation
Conference papers

Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela

Résumé : La simplification de textes est une tâche complexe du traitement automatique des langues. Depuis quelques années, des corpus parallèles de textes originaux et simplifiés sont proposés, permettant d'apprendre différents types d'opérations de simplification à partir de corpus. Dans le but de pouvoir développer et évaluer des systèmes de simplification automatique de textes, cet article s’intéresse au corpus Newsela, un corpus parallèle de textes en langue anglaise avec quatre niveaux de simplification. Nous présentons en détail ce corpus et étudions les différentes transformations caractérisant le passage d’un niveau de simplification à l’autre sur un sous-ensemble de textes, en nous intéressant plus particulièrement aux transformations syntaxiques.
Document type :
Conference papers
Complete list of metadatas

Cited literature [33 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-02786194
Contributor : Sylvain Pogodalla <>
Submitted on : Tuesday, June 23, 2020 - 11:46:25 AM
Last modification on : Thursday, June 25, 2020 - 3:33:24 AM

File

189.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-02786194, version 3

Citation

Rita Hijazi. Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL, Jun 2020, Nancy, France. pp.137-150. ⟨hal-02786194v3⟩

Share

Metrics

Record views

53

Files downloads

22