Le poids des entités nommées dans le filtrage des termes d'un domaine
Résumé
L'extraction automatique de termes est utilisée pour des tâches variées comme l'analyse terminologique, la détection des mots clés pour la recherche d'information et la construction d'ontologies. Les outils de traitement automatique de la langue (TAL) ont la charge d'extraire les termes d'un domaine à partir de corpus spécialisés, mais ces outils n'extraient pas que des termes pertinents. Notre objectif est d'améliorer la sélection des termes pour un domaine donné. Nous proposons des méthodes de filtrage et de pondération de termes qui tiennent compte de la distribution des termes au voisinage des entités nommées et nous montrons qu'elles aident à détecter les termes représentatifs d'un domaine.
Origine : Fichiers produits par l'(les) auteur(s)