天天看点

Communications Chemistry | 层次分子图自监督学习的性质预测

作者:AIDDPro
Communications Chemistry | 层次分子图自监督学习的性质预测

今天给大家讲一篇2023年2月在Communications Chemistry上发布的一篇关于分子属性预测的文章,作者提出了HiMol模型,即通过引入了一个预训练模型来学习分子表征进行分子属性预测。首先设计了一个层次分子图神经网络(HMGNN),该网络将每个分子都提取了节点-基序-分子图三者的层次分子表征。此外,还设计了一个多级别的自监督任务(MSP)预测分子中原子和键的数量。在MoleculeNet上测试结果表明,在分类和回归任务中HiMol都有着竞争性的优势。

分子表征研究背景

分子表征是指利用化学分子的结构和性质来描述和预测分子属性的过程。通过一系列计算方法,可以对分子进行表征,包括描述其结构、电荷分布等信息。这些表征可以用于预测分子的化学反应性、溶解度、药物活性等性质。它是药物设计中重要的研究方向之一。目前很多机器学习算法应用于分子表征领域,其中也有考虑了分子图表征的相关工作,如Zhang等人利用聚类方法学习分子的基序,并将原子的表征作为一个视图的表征,将基序和原子的表征进行对比学习来学习完整的分子表征。然而,对比学习方法需要对原始图进行数据增强,仅仅通过化学键的修改,子结构的删除等方法往往会破坏分子的结构以及其属性。因此,如何设计自监督的预训练任务对于特定下游性质预测任务是至关重要的。

HiMol模型介绍

2.1 HiMol设计流程

如图1所示,对于每个输入格式为SMILES的分子,首先将其转换为分子图的形式,并且根据当前分子图进一步分解为基序以及原子级别的表示,再用GNN为这三个独立的模块提取各自的表征,该方法在不破坏化学结构的条件下提取了分子中重要的子结构。在MSP过程中,分别使用原子级的表征来预测原子类型和键的类型,图级的表征用于预测原子和键的数量。

Communications Chemistry | 层次分子图自监督学习的性质预测

图1HiMol设计流程

实验结果

3.1 分子属性预测中分类任务的表现

作者选择ROC-AUC结果的均值和标准差来评估模型的分类性能,根据图2来看,HiMol在MoleculeNet的六个数据集中大部分都取得了较优的表现。就平均指标来看,HiMol也相较于基准提升了2.4%。此外,其他两个基于motif(基序)的方法(G_Motif 及MGSSL)也比其余基于分子图的方法更有优势,表明基序在捕获在分子图学习中起着重要的作用。

Communications Chemistry | 层次分子图自监督学习的性质预测

图2 分类性能比较

3.2 t-SNE可视化

如图3所示,为了更直观地展示HiMol学习到的表征,作者利用t-SNE方法将分子表征投影到二维空间中,并用不同的颜色来区分分子属性标签。图3a展示了对BACE抑制活性的分子分布,没有活性的位于左上角,有活性的位于右下角。图3b展示了脂水分配系数的分布,可以发现处于3到4之间的分子基本上位于右下角。由此可见HiMol可以区分分子内部的一些属性。

Communications Chemistry | 层次分子图自监督学习的性质预测

图3分子表征投影可视化

3.3消融实验

为了表明多级别的图神经网络(HMGNN)的优势,如图4所示,作者构建了相应的消融实验,在所有基准测试中,HiMol去除基序的表征性能都变差,这表明基序编码在分子表征学习中起着重要的作用。HiMol通过将分子图分解基序来学习分子多级别的表征,有利于获取更多的分子结构特征和功能。

Communications Chemistry | 层次分子图自监督学习的性质预测

图4消融实验展示

结论

作者设计了一个预训练的自监督方法HiMol来有效地学习分子表征,首先基于层次分子图神经网络(HMGNN)来编码节点—基序—分子图之间的多级别表征,该表征体现了分子中多阶特征的相互作用,可以从多个角度捕获更全面的信息。在MoleculeNet中的分子性质预测实验表明,Himol相较于现有基准方法提升较明显,是未来较有前景的工作。

参考文献

  1. Chen Z, Min MR, Parthasarathy S, Ning X (2021) A deep generative model for molecule optimization via one fragment modifcation. Nat Mach Intell 3(12):1040–1049

版权信息

本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。

原创内容未经授权,禁止转载至其他平台。有问题可发邮件至[email protected]

继续阅读