【佳作推荐】上海药物所郑明月小组Nat Comput Sci论文:PBCNet模型用于计算配体分子的相对结合自由能
2023-11-20 ComputArt计算有乐趣 ComputArt计算有乐趣 发表于上海
近期,上海药物所郑明月课题组开发了深度学习模型PBCNet用于快速准确预测配体相对结合自由能。
分子对接结合打分函数的虚拟筛选流程广泛地用于先导化合物发现,已经成为药物设计中的常见范式。在发现了活性先导化合物之后需要进行结构优化,采用的手段通常是在固定先导化合物结构母核的基础上对部分片段作微小的修饰。然而在这一阶段的药物设计过程中打分函数的结果往往不具有指导意义,比较准确的计算手段是通过自由能微扰方法(FEP)计算两个配体分子之间的相对结合自由能。在合理设置参数和微扰过程的情况下,FEP的计算误差在1.0 kcal/mol左右,接近实验精度,可以很好地指导化合物结构优化的方向和策略。然而建立FEP模拟体系的过程较为繁琐。商业软件薛定谔中的FEP+模块尽管使用简单,但是需要收取较为昂贵的费用。另一方面,FEP需要消耗非常大量的计算资源,难以大规模开展。近期,上海药物所郑明月课题组开发了深度学习模型PBCNet(pairwise binding comparison network)用于快速准确预测配体相对结合自由能。测试结果显示,在利用少量数据进行微调优化的情况下,PBCNet可以与FEP+具有相近的性能,但仅需要FEP+十万分之一的计算时间,为先导化合物结构优化设计提供了方便有效的计算工具,相关工作发表在Nature Computational Science上 (Nat. Comput. Sci. 2023, 3, 860–872)。
PBCNet的整体框架如图1所示。首先通过图卷积神经网络从蛋白结合口袋中提取蛋白结构特征之后通过另一组神经网络将蛋白结构特征与配体特征进行融合(图1a)。此后,利用AttentiveFP网络计算融合了蛋白口袋特征的两个配体的最终特征(图1b)。最后,利用提取的特征预测配体之间的相对结合自由能。同时作者为PBCNet添加另一个辅助分类任务帮助模型学习:预测配体1是否比配体2具有更好的亲合性(图1c)。
图1、PBCNet的整体框架。
训练PBCNet需要的数据集的组成为已知复合物结构和相对亲合性数值的配体。为此,作者以BindingDB v.2020为数据来源构建了PBCNet的训练数据集。作者首先从BindingDB中提取了1265组化合物系列,每一组系列中均有化合物具有已知的晶体复合物结构。在每一组化合物中,利用Glide为没有复合物结构的化合物产生对接构象并基于以下规则进行挑选:(1)对接分子与已知晶体复合物结构的配体分子的公共结构片段之间的RMSD值小于2.0 Å;(2)同时具有多个满足条件的构象选取对接得分最高的构象。最后从BindingDB提取IC50数值。经过以上步骤,作者最终获取了971组化合物系列,平均每个系列有39个化合物结构。通过两两配对,作者最终得到约60万个已知结构和相对亲合性数值的一对配体组成的数据集。另外,为了测试PBCNet的性能,作者还构建了两个测试集(FEP1和FEP2,在构建训练集时两个测试集中与训练集重合的部分已被移除)。
作者首先在FEP1和FEP2上测试了PBCNet的性能,结果显示,PBCNet在FEP1和FEP2上分别能达到RMSE 1.11 kcal/mol和1.49 kcal/mol的水平,相比于其他同类型模型和Glide SP以及MM-GBSA均有显著优势,不过并没有超过FEP+。从Spearman相关系数而言,PBCNet在所有的测试体系上均比较稳定,而打分函数Glide SP在不同体系上的性能相差很大。这说明PBCNet的预测结果具有较好的稳定性。
以上测试对应的场景是在未知任何分子活性的情况下应用PBCNet。在实际的分子结构优化过程中,通常已经通过实验测得几个配体分子的亲合力,因此可以用这几个样本对模型进行调优训练。作者从每一个系列中随机挑选2-10个化合物用于调优训练PBCNet,并测试了在不同样本数下PBCNet的性能。结果显示,使用少量样本进行训练后,PBCNet可以与FEP+具有相近的预测性能(图2)。由于PBCNet具有比FEP+约十万倍的计算效率,因此PBCNet在实际的结构优化药物设计中可以快速高效地进行应用。
图2、PBCNet在FEP1和FEP2测试集上进行小样本学习后的表现,其中蓝色虚线为FEP+的测试结果。PBCNet在进行小样本调优后具有与FEP+相当的性能。
作者还模拟了PBCNet在实际项目中的应用,以评估应用PBCNet带来的效率提升。作者总共设计了九组数据,对比了在PBCNet的预测结果指导下发现最优活性化合物的次序并和实际发现最优化合物的次序。结果显示,应用PBCNet可以加速分子结构优化项目约473%,同时减少约30%的实验材料消耗。以上结果说明了PBCNet在实际分子结构优化中的应用价值。
总结
作者在此项工作中开发了基于孪生图神经网络的PBCNet模型,可以用于预测具有共同母核结构的一组化合物的活性高低,帮助新药研发人员决定同系化合物的合成优先级。作者展示了PBCNet模型具有较好的准确性和极高的计算效率,可以有效地指导对分子结构进行优化。为了方便使用,作者在其维护的网络服务器上提供了便捷的图形化界面(https://pbcnet.alphama.com.cn/index)。
参考文献
Jie Yu, Zhaojun Li, Geng Chen, Xiangtai Kong, Jie Hu, Dingyan Wang, Duanhua Cao, Yanbei Li, Ruifeng Huo, Gang Wang, Xiaohong Liu, Hualiang Jiang, Xutong Li, Xiaomin Luo & Mingyue Zheng, Computing the relative binding affinity of ligands based on a pairwise binding comparison network. Nat. Comput. Sci. 2023, 3, 860–872
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#深度学习模型# #PBCNet# #相对结合自由能# #神经网络将蛋白#
79