Stratégies de sélection des exemples pour l’apprentissage actif avec des champs aléatoires conditionnels

Vincent Claveau 1 Ewa Kijak 1
1 LinkMedia - Creating and exploiting explicit links between multimedia fragments
IRISA-D6 - MEDIA ET INTERACTIONS, Inria Rennes – Bretagne Atlantique
Résumé : Beaucoup de problèmes de TAL sont désormais modélisés comme des tâches d’apprentissage supervisé. De ce fait, le coût des annotations des exemples par l’expert représente un problème important. L’apprentissage actif (active learning) apporte un cadre à ce problème, permettant de contrôler le coût d’annotation tout en maximisant, on l’espère, la performance de la tâche visée, mais repose sur le choix difficile des exemples à soumettre à l’expert. Dans cet article, nous examinons et proposons des stratégies de sélection des exemples pour le cas spécifique des champs aléatoires conditionnels (Conditional Random Fields, CRF), outil largement utilisé en TAL. Nous proposons d’une part une méthode simple corrigeant un biais de certaines méthodes de l’état de l’art. D’autre part, nous détaillons une méthode originale de sélection s’appuyant sur un critère de respect des proportions dans les jeux de données manipulés. Le bien-fondé de ces propositions est vérifié au travers de plusieurs tâches et jeux de données, incluant reconnaissance d’entités nommées, chunking, phonétisation, désambiguïsation de sens.
Type de document :
Communication dans un congrès
Conférence TALN 2015, Jun 2015, Caen, France. Actes de la conférence TALN 2015, Actes de la conférence TALN 2015
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01206847
Contributeur : Vincent Claveau <>
Soumis le : mardi 29 septembre 2015 - 16:31:07
Dernière modification le : mercredi 2 août 2017 - 10:09:06

Identifiants

  • HAL Id : hal-01206847, version 1

Citation

Vincent Claveau, Ewa Kijak. Stratégies de sélection des exemples pour l’apprentissage actif avec des champs aléatoires conditionnels. Conférence TALN 2015, Jun 2015, Caen, France. Actes de la conférence TALN 2015, Actes de la conférence TALN 2015. <hal-01206847>

Partager

Métriques

Consultations de la notice

235