CRAFTML, une forêt aléatoire efficace pour l'apprentissage multi-label extrême

Wissam Siblini; Frank Meyer; Pascale Kuntz

Communication Dans Un Congrès Année : 2019

CRAFTML, une forêt aléatoire efficace pour l'apprentissage multi-label extrême

(1) , (2) , (1)

1
2

Wissam Siblini

Fonction : Auteur
PersonId : 993309

Laboratoire des Sciences du Numérique de Nantes

Frank Meyer

Fonction : Auteur
PersonId : 931746

Mathematics and Computer Science Division [ANL]

Pascale Kuntz

Fonction : Auteur
PersonId : 853783
IdRef : 103904638

Laboratoire des Sciences du Numérique de Nantes

Résumé

L'apprentissage multi-label extrême (noté XML pour "eXtreme Multi-label Learning") considère de grands volumes de données où chaque observation est annotée avec quelques labels parmi des centaines de milliers de possibilités. Les méthodes basées sur les arbres, qui divisent hiérarchiquement l'apprentis-sage en sous-problèmes à petite échelle, sont particulièrement prometteuses dans ce contexte pour réduire les complexités d'apprentissage et de prédiction et pour ouvrir la voie à la parallélisation. Cependant, les meilleures approches actuelles n'exploitent pas la diversification des arbres qui a pourtant montré son efficacité dans les forêts aléatoires et elles ont recours à des stratégies de partitionnement complexes. Pour surmonter ces limites, nous introduisons ici un nouvel algo-rithme de forêt avec des arbres diversifiés et une stratégie de partitionnement adaptée à l'XML appelé CRAFTML. Des comparaisons expérimentales sur huit jeux de données tirés de la littérature extrême montrent qu'il est plus performant que les autres approches arborescentes de l'état de l'art.

Domaines

Informatique [cs]

Fichier principal

paper_craftml_siblini.pdf (157.03 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Wissam Siblini : Connectez-vous pour contacter le contributeur

https://hal.science/hal-02008037

Soumis le : mardi 5 février 2019-15:03:57

Dernière modification le : mardi 6 juin 2023-15:31:50

Archivage à long terme le : lundi 6 mai 2019-15:42:09

Dates et versions

hal-02008037 , version 1 (05-02-2019)

Identifiants

HAL Id : hal-02008037 , version 1

Citer

Wissam Siblini, Frank Meyer, Pascale Kuntz. CRAFTML, une forêt aléatoire efficace pour l'apprentissage multi-label extrême. Extraction et Gestion de Connaissances (EGC 2019), Jan 2019, Metz, France. ⟨hal-02008037⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-NANTES INSTITUT-TELECOM CNRS EC-NANTES UNAM LS2N LS2N-DUKE NANTES-UNIVERSITE

55 Consultations

132 Téléchargements

CRAFTML, une forêt aléatoire efficace pour l'apprentissage multi-label extrême

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager