État de l'art des méthodes d'extraction automatique de termes-clés - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

État de l'art des méthodes d'extraction automatique de termes-clés

Résumé

Cet article présente les principales méthodes d'extraction automatique de termes-clés. La tâche d'extraction automatique de termes-clés consiste à analyser un document pour en extraire les expressions (phrasèmes) les plus représentatives de celui-ci. Les méthodes d'extraction automatique de termes-clés sont réparties en deux catégories : les méthodes supervisées et les méthodes non supervisées. Les méthodes supervisées réduisent la tâche d'extraction de termes-clés à une tâche de classification binaire (tous les phrasèmes sont classés parmi les termes-clés ou les non termes-clés). Cette classification est possible grâce à une phase préliminaire d'apprentissage, phase qui n'est pas requise par les méthodes non-supervisées. Ces dernières utilisent des caractéristiques (traits) extraites du document analysé (et parfois d'une collection de documents de références) pour vérifier des propriétés permettant d'identifier ses termes-clés.
Fichier principal
Vignette du fichier
extraction_de_termes_cles_etat_de_l_art.pdf (117.66 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00821671 , version 1 (11-05-2013)

Identifiants

  • HAL Id : hal-00821671 , version 1

Citer

Adrien Bougouin. État de l'art des méthodes d'extraction automatique de termes-clés. Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL), Jun 2013, Sables d'Olonne, France. ⟨hal-00821671⟩
602 Consultations
2932 Téléchargements

Partager

Gmail Facebook X LinkedIn More