Application des méthodes à noyaux sur graphes pour la prédiction des propriétés des molécules. - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2013

Graph kernels for the prediction of molecular properties.

Application des méthodes à noyaux sur graphes pour la prédiction des propriétés des molécules.

Résumé

This work deals with the application of graph kernel methods to the prediction of molecular properties. In this document, we first present a state of the art of graph kernels used in chemoinformatics and particurlarly those which are based on bags of patterns. Within this framework, we introduce the treelet kernel based on a set of trees which allows to encode most of the structural information encoded in molecular graphs. We also propose a combination of this kernel with multiple kernel learning methods in order to extract a subset of relevant patterns. This kernel is then extended by including cyclic information using two molecular representations defined by the relevant cycle graph and the relevant cycle hypergraph. Relevant cycle graph allows to encode the cyclic system of a molecule whereas the relevant cycle hypergraph allows to encode the cyclic system and its adjacency relationships with acyclic parts of the molecule. We also propose two kernels dealing with this two molecular representations. Finally, the last part aims to define two graph kernels based on graph edit distance. The first one is based on a regularisation operator using graph edit distance. The second one allows to compare non-isomorphic treelets thanks to an algorithm computing a treelet edit distance.
Cette thèse s'intéresse à l'application des méthodes à noyaux sur graphes pour la prédiction de propriétés moléculaires. Dans ce manuscrit, nous présentons un état de l'art des méthodes à noyaux sur graphes définies dans le cadre de la chémoinformatique et plus particulièrement les noyaux sur graphes basés sur les sacs de motifs. Dans ce cadre, nous proposons un nouveau noyau sur graphes basé sur un ensemble explicite de sous-arbres, appelés treelets, permettant d'encoder une grande partie de l'information structurelle acyclique des graphes moléculaires. Nous proposons également de combiner ce noyau avec des méthodes d'apprentissage à noyaux multiples afin d'extraire un ensemble de motifs pertinents. Cette contribution est ensuite étendue en incluant l'information cyclique encodée par deux représentations moléculaires définies par le graphe de cycles pertinents et l'hypergraphe de cycles pertinents. Le graphe des cycles pertinents permet d'encoder le système cyclique d'une molécule. L'hypergraphe de cycles pertinents correspond à une nouvelle représentation moléculaire permettant d'encoder à la fois le système cyclique d'une molécule ainsi que les relations d'adjacence entre les cycles et les parties acycliques. Nous proposons également deux noyaux sur graphes utilisant ces représentations. Enfin, la dernière partie vise à définir des noyaux sur graphes pour la chémoinformatique basés sur la distance d'édition. Un premier noyau est basé sur un opérateur de régularisation utilisant la distance d'édition entre graphes moléculaires. Le second noyau introduit la comparaison de treelets dissimilaires basée sur un algorithme de calcul de la distance d'édition entre treelets.
Fichier principal
Vignette du fichier
these-v1.pdf (1.92 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00933187 , version 1 (20-01-2014)

Identifiants

  • HAL Id : tel-00933187 , version 1

Citer

Benoit Gaüzère. Application des méthodes à noyaux sur graphes pour la prédiction des propriétés des molécules.. Chemo-informatique. Université de Caen, 2013. Français. ⟨NNT : ⟩. ⟨tel-00933187⟩
403 Consultations
1241 Téléchargements

Partager

Gmail Facebook X LinkedIn More