Continuous improvement of a document treatment chain using reinforcement learning

Esther Nicart; Bruno Zanuttini; Bruno Grilhères; Patrick Giroux

Communication Dans Un Congrès Année : 2015

Continuous improvement of a document treatment chain using reinforcement learning

Amélioration continue d'une chaîne de traitement de documents avec l'apprentissage par renforcement

(1, 2) , (2) , (1) , (3, 1)

1
2
3

Esther Nicart

Fonction : Auteur

Airbus Defence and Space

Equipe MAD - Laboratoire GREYC - UMR6072

Bruno Zanuttini

Fonction : Auteur

Equipe MAD - Laboratoire GREYC - UMR6072

Bruno Grilhères

Fonction : Auteur

Airbus Defence and Space

Patrick Giroux

Fonction : Auteur

Institut des Sciences de la Terre

Airbus Defence and Space

Résumé

We tackle the problem of continuous improvement of a treatment chain which extracts events from open-source documents. We use the human operators' corrections to allow the treatment chain to learn from its errors, and self-improve generally. We apply reinforcement learning (specifically Q-learning) to this problem, where the actions are the services of a treatment chain for the extraction of information. The objective is to use the user feedback to allow the system to learn the ideal configuration of the services (order, gazetteers, and extraction rules) based on the characteristics of the documents treated (language, type, etc.). We carry out the first experiments with automatically generated feedback data, and the results are encouraging.

Nous nous intéressons au problème de l'amélioration continue d'une chaîne de traitement de documents, visant à extraire des événements dans des documents provenant de sources ouvertes. Il s'agit de tirer parti des corrections effectuées par les opérateurs humains pour que la chaîne de traitement apprenne de ses erreurs, et s'améliore de façon générale. Nous appliquons l'apprentissage par renforcement (en l'occurrence, le Q-Learning) à ce problème, où les actions sont les services d'une chaîne de traitement d'extraction de l'information. L'objectif est de profiter du feedback utilisateur pour permettre au système d'apprendre la configuration idéale des services (ordonnancement, gazetteers et règles d'extraction) en fonction des caractéristiques des documents à traiter (langue, type, etc.). Nous menons de premières expériences avec des données de feedback générées automatiquement à partir d'un oracle, et les résultats sont encourageants.

Mots clés

OSINT (Open Source INTelligence) Artificial intelligence Reinforcement learning Extraction and knowledge management Man-machine interaction

Renseignement d'origine sources ouvertes (ROSO) Interaction homme-machine Extraction et gestion des connaissances Intelligence artificielle Apprentissage par renforcement

Domaines

Intelligence artificielle [cs.AI] Apprentissage [cs.LG] Recherche d'information [cs.IR] Interface homme-machine [cs.HC] Informatique et langage [cs.CL] Informatique et théorie des jeux [cs.GT]

Fichier principal

IC2015v2-1.pdf (308.42 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Esther Nicart : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01165692

Soumis le : mardi 8 septembre 2015-16:24:42

Dernière modification le : jeudi 4 avril 2024-21:25:04

Archivage à long terme le : vendredi 5 mai 2017-13:12:14

Dates et versions

hal-01165692 , version 1 (19-06-2015)

hal-01165692 , version 2 (08-09-2015)

Identifiants

HAL Id : hal-01165692 , version 2

Citer

Esther Nicart, Bruno Zanuttini, Bruno Grilhères, Patrick Giroux. Continuous improvement of a document treatment chain using reinforcement learning. IC2015, Jun 2015, Rennes, France. ⟨hal-01165692v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

IRD INSU UNIV-SAVOIE UGA CNRS IC OSUG GREYC GREYC-MAD ISTERRE COMUE-NORMANDIE IC-2015 ENSICAEN UNICAEN

406 Consultations

124 Téléchargements

Continuous improvement of a document treatment chain using reinforcement learning

Amélioration continue d'une chaîne de traitement de documents avec l'apprentissage par renforcement

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager