Catégorisation de textes en domaines et genres : complémentarité des indexations lexicale et morphosyntaxique

Résumé : On considère généralement que les domaines sont corrélés au niveau du contenu (mots, termes, etc.) tandis que les genres sont discriminés au niveau morphosyntaxique. Malgré les bons résultats obtenus par ces choix méthodologiques, peu de travaux ont cherché à mesurer l'impact et la complémentarité des deux niveaux de description pour la classification. Cette étude vise ainsi à évaluer l'intérêt discriminant des descripteurs morphosyntaxiques et thématiques pour classer les genres et les domaines. Des résultats encourageants sont obtenus sur un corpus pilote de textes scientifiques français.
Type de document :
Article dans une revue
Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2006, 9, pp.61-76
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-00084803
Contributeur : Guillaume Cleuziou <>
Soumis le : lundi 10 juillet 2006 - 16:13:52
Dernière modification le : jeudi 7 février 2019 - 17:17:36

Identifiants

  • HAL Id : hal-00084803, version 1

Collections

Citation

Céline Poudat, Guillaume Cleuziou, Viviane Clavier. Catégorisation de textes en domaines et genres : complémentarité des indexations lexicale et morphosyntaxique. Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2006, 9, pp.61-76. 〈hal-00084803〉

Partager

Métriques

Consultations de la notice

183