Une méthode paramétrique et robuste de classification semi-supervisée avec rejet
Résumé
En classification et plus généralement en apprentissage, on distingue classiquement deux approches: le cas supervisé et le cas non supervisé. On peut combiner celles-ci dans un apprentissage semi-supervisé. Dans ce cadre, on enrichit un ensemble de données non étiquetées par un certain nombre d'exemples étiquetés. Ces derniers, en proportion généralement faible, servent à guider les algorithmes de classification via leur paramétrage et leurs conditions d'initialisation. Dans cet article, nous rappelons quelques techniques actuelles de semi-supervision et références du domaine. Nous proposons une extension de l'algorithme de classification par partition que nous avons proposé dans (Saint-Jean et al., 2000) pour prendre en compte la semi-supervision. Nous proposons également une heuristique pour le choix du paramètre du M-estimateur de Huber tenant compte de la supervision partielle. Enfin, nous présentons les résultats de notre approche sur des jeux de données artificiels et standards du domaine.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...