Continuous improvement of a document treatment chain using reinforcement learning - 26èmes Journées francophones d'Ingénierie des Connaissances Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Continuous improvement of a document treatment chain using reinforcement learning

Amélioration continue d'une chaîne de traitement de documents avec l'apprentissage par renforcement

Résumé

We tackle the problem of continuous improvement of a treatment chain which extracts events from open-source documents. We use the human operators' corrections to allow the treatment chain to learn from its errors, and self-improve generally. We apply reinforcement learning (specifically Q-learning) to this problem, where the actions are the services of a treatment chain for the extraction of information. The objective is to use the user feedback to allow the system to learn the ideal configuration of the services (order, gazetteers, and extraction rules) based on the characteristics of the documents treated (language, type, etc.). We carry out the first experiments with automatically generated feedback data, and the results are encouraging.
Nous nous intéressons au problème de l'amélioration continue d'une chaîne de traitement de documents, visant à extraire des événements dans des documents provenant de sources ouvertes. Il s'agit de tirer parti des corrections effectuées par les opérateurs humains pour que la chaîne de traitement apprenne de ses erreurs, et s'améliore de façon générale. Nous appliquons l'apprentissage par renforcement (en l'occurrence, le Q-Learning) à ce problème, où les actions sont les services d'une chaîne de traitement d'extraction de l'information. L'objectif est de profiter du feedback utilisateur pour permettre au système d'apprendre la configuration idéale des services (ordonnancement, gazetteers et règles d'extraction) en fonction des caractéristiques des documents à traiter (langue, type, etc.). Nous menons de premières expériences avec des données de feedback générées automatiquement à partir d'un oracle, et les résultats sont encourageants.
Fichier principal
Vignette du fichier
IC2015v2-1.pdf (308.42 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01165692 , version 1 (19-06-2015)
hal-01165692 , version 2 (08-09-2015)

Identifiants

  • HAL Id : hal-01165692 , version 2

Citer

Esther Nicart, Bruno Zanuttini, Bruno Grilhères, Patrick Giroux. Continuous improvement of a document treatment chain using reinforcement learning. IC2015, Jun 2015, Rennes, France. ⟨hal-01165692v2⟩
406 Consultations
124 Téléchargements

Partager

Gmail Facebook X LinkedIn More