Étude lexicographique de sous-graphes pour l’élaboration de modèles structures à activité – cas de la chimie organique

Abstract : Les modèles structure–activité (QSAR) cherchent à extraire de l’infor- mation utile dans des observations relatives à des structures, dans le but d’asso- cier des éléments structurels à une activité d’ordre macroscopique. Un exemple typique est celui de la chimie organique, où certaines propriétés physiques et chimiques d’une molécule sont fonction de son agencement interne (conforma- tion). On retrouve en particulier des sous-structures caractéristiques, nommées groupements fonctionnels ou fragments qui s’apparentent à des sous-graphes, ainsi que des structures de liaison. Nous proposons une analyse lexicographique de ces fragments et montrons que ceux-ci suivent approximativement des lois de puissance, proches des lois de Zipf observées dans le cadre des langues na- turelles. En poursuivant cette analogie, nous développons la notion de "plon- gement" de fragment (fragment-embedding). Nous montrons l’intérêt de cette notion et en déduisons quelques perspectives.
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-02000156
Contributor : Pierre-François Marteau <>
Submitted on : Wednesday, January 30, 2019 - 2:00:37 PM
Last modification on : Friday, April 12, 2019 - 8:08:03 AM

Identifiers

  • HAL Id : hal-02000156, version 1

Citation

Nicolas Bloyet, Pierre-François Marteau, Emmanuel Frénod. Étude lexicographique de sous-graphes pour l’élaboration de modèles structures à activité – cas de la chimie organique. Extraction et Gestion des Connaissances (EGC 2019), EGC, Jan 2019, Metz, France. pp.303-308. ⟨hal-02000156⟩

Share

Metrics

Record views

108