Skip to Main content Skip to Navigation
Conference papers

Impact de la structure logique des documents sur les modèles distributionnels : expérimentations sur le corpus TALN

Résumé : Nous présentons une expérience visant à mesurer en quoi la structure logique d'un document impacte les représentations lexicales dans les modèles de sémantique distributionnelle. En nous basant sur des documents structurés (articles de recherche en TAL) nous comparons des modèles construits sur des corpus obtenus par suppression de certaines parties des textes du corpus : titres de section, résumés, introductions et conclusions. Nous montrons que malgré des différences selon les parties et le lexique pris en compte, ces zones réputées particulièrement informatives du contenu d'un article ont un impact globalement moins significatif que le reste du texte sur la construction du modèle.
Complete list of metadata

Cited literature [23 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-02784760
Contributor : Sylvain Pogodalla <>
Submitted on : Tuesday, June 23, 2020 - 12:02:48 PM
Last modification on : Wednesday, October 14, 2020 - 4:29:28 PM

File

44.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-02784760, version 3

Citation

Ludovic Tanguy, Cécile Fabre, Yoann Bard. Impact de la structure logique des documents sur les modèles distributionnels : expérimentations sur le corpus TALN. Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition), Jun 2020, Nancy, France. pp.122-135. ⟨hal-02784760v3⟩

Share

Metrics

Record views

75

Files downloads

88