Apprentissage de réseaux par agrégation bayésienne d’arbres couvrants
Résumé
Nous proposons dans cet article une méthode d’apprentissage de structure de modèle graphique basée sur les arbres couvrants. Étant donné un échantillon indépendant, Chow et Liu (1968) ont proposé un algorithme permettant de calculer l’arbre du maximum de vraisemblance. Cet algorithme consiste en une recherche d’arbre couvrant maximal où la matrice d’information mutuelle empirique entre les paires de variables est utilisée pour pondérer les arêtes. Nous présentons ici le pendant bayésien de cette approche fréquentiste. Une distribution a posteriori est calculée sur l’espace des arbres couvrants, ce qui nous permet ensuite de donner une probabilité a posteriori pour chacune des arêtes. L’intégration sur les paramètres de chacun des modèles est évitée en effectuant une approximation de type BIC. L’algorithme utilise un résultat d’algèbre appelé théorème arbre-matrice pour effectuer tous les calculs de manière exacte et rapide.