Apprentissage de fonctions d'ordonnancement avec un flux de données non-étiquetées

Résumé : Dans ce papier, nous traitons de l’apprentissage de fonctions d’ordonnancement bipartite avec des données partiellement étiquetées. Contrairement aux études précédentes, nous supposons que les données non-étiquetées arrivent en grande quantité de façon séquentielle. Ce cadre évite de garder en mémoire toute la base d’apprentissage et permet de traiter les applications de routage d’information faisant intervenir des flux de données. La méthode proposée peut être vue comme une extension des modèles auto–apprenants proposés en classification semi–supervisée. Le modèle est d’abord initialisé sur les instances étiquetées puis traite à la volée les données non-étiquetées en continu. Notre algorithme se base sur une méthode d’optimisation en ligne des SVMs linéaires. Les expériences menées sur un grand nombre de collections montrent que le flux de données non-étiquetées permet d’améliorer les performances d’une fonction apprise uniquement sur les instances étiquetées.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01294604
Contributor : Lip6 Publications <>
Submitted on : Tuesday, March 29, 2016 - 3:11:51 PM
Last modification on : Thursday, March 21, 2019 - 1:06:52 PM

Identifiers

  • HAL Id : hal-01294604, version 1

Citation

Tuong Vinh Truong, Massih-Reza Amini, Patrick Gallinari. Apprentissage de fonctions d'ordonnancement avec un flux de données non-étiquetées. Conference d'Apprentissage, CAP 2009, May 2009, Hammamet, Tunisie. ⟨hal-01294604⟩

Share

Metrics

Record views

182