CRAFTML, une forêt aléatoire efficace pour l'apprentissage multi-label extrême - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

CRAFTML, une forêt aléatoire efficace pour l'apprentissage multi-label extrême

Résumé

L'apprentissage multi-label extrême (noté XML pour "eXtreme Multi-label Learning") considère de grands volumes de données où chaque observation est annotée avec quelques labels parmi des centaines de milliers de possibilités. Les méthodes basées sur les arbres, qui divisent hiérarchiquement l'apprentis-sage en sous-problèmes à petite échelle, sont particulièrement prometteuses dans ce contexte pour réduire les complexités d'apprentissage et de prédiction et pour ouvrir la voie à la parallélisation. Cependant, les meilleures approches actuelles n'exploitent pas la diversification des arbres qui a pourtant montré son efficacité dans les forêts aléatoires et elles ont recours à des stratégies de partitionnement complexes. Pour surmonter ces limites, nous introduisons ici un nouvel algo-rithme de forêt avec des arbres diversifiés et une stratégie de partitionnement adaptée à l'XML appelé CRAFTML. Des comparaisons expérimentales sur huit jeux de données tirés de la littérature extrême montrent qu'il est plus performant que les autres approches arborescentes de l'état de l'art.
Fichier principal
Vignette du fichier
paper_craftml_siblini.pdf (157.03 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02008037 , version 1 (05-02-2019)

Identifiants

  • HAL Id : hal-02008037 , version 1

Citer

Wissam Siblini, Frank Meyer, Pascale Kuntz. CRAFTML, une forêt aléatoire efficace pour l'apprentissage multi-label extrême. Extraction et Gestion de Connaissances (EGC 2019), Jan 2019, Metz, France. ⟨hal-02008037⟩
55 Consultations
132 Téléchargements

Partager

Gmail Facebook X LinkedIn More