Le poids des entités nommées dans le filtrage des termes d'un domaine - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Le poids des entités nommées dans le filtrage des termes d'un domaine

Résumé

L'extraction automatique de termes est utilisée pour des tâches variées comme l'analyse terminologique, la détection des mots clés pour la recherche d'information et la construction d'ontologies. Les outils de traitement automatique de la langue (TAL) ont la charge d'extraire les termes d'un domaine à partir de corpus spécialisés, mais ces outils n'extraient pas que des termes pertinents. Notre objectif est d'améliorer la sélection des termes pour un domaine donné. Nous proposons des méthodes de filtrage et de pondération de termes qui tiennent compte de la distribution des termes au voisinage des entités nommées et nous montrons qu'elles aident à détecter les termes représentatifs d'un domaine.
Fichier principal
Vignette du fichier
OmraneTIA2011.pdf (138.72 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00626843 , version 1 (27-09-2011)
hal-00626843 , version 2 (03-10-2011)
hal-00626843 , version 3 (25-10-2011)
hal-00626843 , version 4 (02-01-2012)

Identifiants

  • HAL Id : hal-00626843 , version 4

Citer

Nouha Omrane, Adeline Nazarenko, Sylvie Szulman. Le poids des entités nommées dans le filtrage des termes d'un domaine. 9ème conférence internationale de Terminologie et Intelligence Artificielle, Nov 2011, Paris, France. pp.80-86. ⟨hal-00626843v4⟩
148 Consultations
147 Téléchargements

Partager

Gmail Facebook X LinkedIn More