Variabilité des performances des outils de TAL et genre textuel : Cas des patrons lexico-syntaxiques
Résumé
. In this paper, we report a set of results obtained by tuning a base of lexical relation patterns for CAMÉLÉON, a tool that supports ontology engineering from texts. When evaluating these patterns on eight different corpora, their efficiency varied strongly depending on the test corpus. This leads to two conclusions: 1. in the scope of NLP, users must be provided with pieces of information about the corpora used for evaluating the NLP task; 2. NLP research should contribute to a better text characterisation through an appropriate definition of text genres, which should go beyond a rigid and unique text classification.
Nous rapportons dans cet article un ensemble de résultats liés à la mise au point d'une base de marqueurs de relations lexicales pour un outil d'aide à la réalisation d'ontologies à partir de textes, CAMÉLÉON. L'évaluation de ces patrons sur huit corpus différents montre une grande variation de leurs performances selon le corpus testé. Cela nous conduit à deux sortes de conclusions : 1. dans le cadre de traitements automatiques, il est nécessaire de fournir à l'utilisateur des informations sur les corpus avec lesquels ces traitements ont été mis au point ; 2. la recherche en matière de TAL doit contribuer à définir une meilleure caractérisation des textes et des genres textuels en relation avec les traitements possibles, au-delà d'une classification unique et rigide des textes.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...