Probabilistic Graphical Model Structure Learning: Application to Multi-Label Classification

Maxime Gasse 1
1 DM2L - Data Mining and Machine Learning
LIRIS - Laboratoire d'InfoRmatique en Image et Systèmes d'information
Résumé : Dans cette thèse, nous nous intéressons au problème spécifique de l’apprentissage de structure de modèles graphiques probabilistes, c’est-à-dire trouver la structure la plus efficace pour représenter une distribution, à partir seulement d’un ensemble d’échantillons D ∼ p(v). Dans une première partie, nous passons en revue les principaux modèles graphiques probabilistes de la littérature, des plus classiques (modèles dirigés, non-dirigés) aux plus avancés (modèles mixtes, cycliques etc.). Puis nous étudions particulièrement le problème d’apprentissage de structure de modèles dirigés (réseaux Bayésiens), et proposons une nouvelle méthode hybride pour l’apprentissage de structure, H2PC (Hybrid Hybrid Parents and Children), mêlant une approche à base de contraintes (tests statistiques d’indépendance) et une approche à base de score (probabilité postérieure de la structure). Dans un second temps, nous étudions le problème de la classification multi-label, visant à prédire un ensemble de catégories (vecteur binaire y) pour un objet donné (vecteur x). Dans ce contexte, l’utilisation de modèles graphiques probabilistes pour représenter la distribution conditionnelle des catégories prend tout son sens, particulièrement dans le but minimiser une fonction coût complexe. Nous passons en revue les principales approches utilisant un modèle graphique probabiliste pour la classification multi-label (Probabilistic Classifier Chain, Conditional Dependency Network, Bayesian Network Classifier, Conditional Random Field, Sum-Product Network), puis nous proposons une approche générique visant à identifier une factorisation de p(y|x) en distributions marginales disjointes, en s’inspirant des méthodes d’apprentissage de structure à base de contraintes. Nous démontrons plusieurs résultats théoriques, notamment l’unicité d’une décomposition minimale, ainsi que trois procédures quadratiques sous diverses hypothèses à propos de la distribution jointe p(x, y). Enfin, nous mettons en pratique ces résultats afin d’améliorer la classification multi-label avec les fonctions coût F-loss et zero-one loss.
Type de document :
Thèse
Artificial Intelligence [cs.AI]. Université Lyon 1 - Claude Bernard, 2017. English. <NNT : 2017LYSE1003>
Liste complète des métadonnées


https://hal.archives-ouvertes.fr/tel-01442613
Contributeur : Maxime Gasse <>
Soumis le : mercredi 1 février 2017 - 18:47:39
Dernière modification le : mercredi 8 février 2017 - 01:05:26

Identifiants

  • HAL Id : tel-01442613, version 2

Collections

Citation

Maxime Gasse. Probabilistic Graphical Model Structure Learning: Application to Multi-Label Classification. Artificial Intelligence [cs.AI]. Université Lyon 1 - Claude Bernard, 2017. English. <NNT : 2017LYSE1003>. <tel-01442613v2>

Partager

Métriques

Consultations de
la notice

428

Téléchargements du document

263