Modèle crédibiliste pour l'échantillonnage en apprentissage actif - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2021

Modèle crédibiliste pour l'échantillonnage en apprentissage actif

Résumé

In machine learning, training a classifier on large dataset requires an important amount of labels which is expensive in terms of human resources and money. A possible solution to this problem is to use crowdsourcing in order to label the data. Although, non-expert people do not always have the knowledge to do their work correctly, leading to introducing errors in labeling. Active learning offers a solution to the labeling cost by making the classifier choose the data it wants to label in order to reach good performance with fewer labels. By combining active learning and belief functions, it becomes possible to model the errors and uncertainty in labels. We propose a new sampling method implying belief entropies.
En apprentissage automatique, la performance d'un modèle supervisé dépend souvent du volume de donnéeś etiquetées. Entraîner un modèle sur un grand nombre de données nécessite donc l'étiquetage de beaucoup d'observations et requiert souvent une expertise coûteuse en temps et en argent. Une des solutions consiste alorsà externaliser le travail d'étiquetageà une foule de contributeurs dont les qualifications visa -vis du domaineétudié seront nécessairement inégales, occasionnant des erreurs d'étiquetage. L'apprentissage actif propose une solution au problème de coût lié auxétiquettes, en impliquant le classificateur dans le choix des données d'entraînement. Ce paradigme peutêtre combinéà la théorie des fonctions de croyance afin de modéliser l'incertitude dans l'étiquetage des données. Nous proposons dans cet article une méthode pour sélectionner les observationsà etiqueter, fondée sur des entropies crédibilistes.
Fichier principal
Vignette du fichier
LFA_2021_paper_19_post_review.pdf (300.8 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03327140 , version 1 (27-08-2021)

Identifiants

  • HAL Id : hal-03327140 , version 1

Citer

Daniel Zhu, Arnaud Martin, Jean-Christophe Dubois, Yolande Le Gall, Vincent Lemaire. Modèle crédibiliste pour l'échantillonnage en apprentissage actif. Rencontres francophones sur la logique floue et ses applications, Oct 2021, Paris, France. ⟨hal-03327140⟩
135 Consultations
85 Téléchargements

Partager

Gmail Facebook X LinkedIn More