Catégorisation de textes en domaines et genres : complémentarité des indexations lexicale et morphosyntaxique

Résumé : On considère généralement que les domaines sont corrélés au niveau du contenu (mots, termes, etc.) tandis que les genres sont discriminés au niveau morphosyntaxique. Malgré les bons résultats obtenus par ces choix méthodologiques, peu de travaux ont cherché à mesurer l'impact et la complémentarité des deux niveaux de description pour la classification. Cette étude vise ainsi à évaluer l'intérêt discriminant des descripteurs morphosyntaxiques et thématiques pour classer les genres et les domaines. Des résultats encourageants sont obtenus sur un corpus pilote de textes scientifiques français.
Document type :
Journal articles
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-00084803
Contributor : Guillaume Cleuziou <>
Submitted on : Monday, July 10, 2006 - 4:13:52 PM
Last modification on : Thursday, February 7, 2019 - 5:17:36 PM

Identifiers

  • HAL Id : hal-00084803, version 1

Collections

Citation

Céline Poudat, Guillaume Cleuziou, Viviane Clavier. Catégorisation de textes en domaines et genres : complémentarité des indexations lexicale et morphosyntaxique. Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2006, 9, pp.61-76. ⟨hal-00084803⟩

Share

Metrics

Record views

188