通过对接打分引导的深度生成模型用于活性分

近日,一篇关于生成分子的论文:《DeepGenerationModelGuidedbytheDockingScoreforActiveMolecularDesign》于年5月发表在JCIM杂志。作者提出了一种名为COMG的分子生成模型,通过考虑对接打分和三维药效团信息来生成同时具有新颖性和高活性的化合物。

研究背景

现代药物研发中一个重要的问题是如何设计满足预期性质的新分子。基于深度学习的分子生成技术在搜索和优化潜在药物分子方面显示出了巨大的优势。深度生成模型不仅在探索化学空间方面更加高效,而且在引入先验知识的情况下生成具有所需性质的新分子方面也表现出色。

目标导向的分子生成在分子设计中非常有优势,因为它能够生成具有所需性质的分子。最近的研究表明,将分子对接方法与生成模型相结合能够设计具有活性的分子,也就是说,这种方法能够在分子生成的过程中优化与目标的结合活性。然而,仅考虑经典的评分函数是不够的。另一种优化生成分子活性的方法是在生成过程中使用药效团信息作为目标函数,但这种方法可能会导致潜在药物分子的骨架新颖性较差。

这篇论文介绍了一种新的基于条件优化的分子生成模型,它采用药效团信息和对接打分作为分子生成的约束条件,可以生成具有所需性质的新分子。作者利用COMG模型成功设计出了潜在的候选药物,证明了该模型的有效性。

方法

2.1生成模型

作者采用多目标条件变分自编码器(CVAE)作为生成模型的架构。CVAE通过在变分自编码器的编码和解码过程中引入额外的约束条件,扩展了标准的VAE框架(图1)。

图1COMG的工作流程示意图

2.2分子表示

为了训练生成模型,作者从ZINC15数据库中筛选出大量类药分子,并将其转换为SELFIES。然后将每个字符转换为一个one-hot向量,形成一个输入矩阵,并将其与预定义的条件向量连接在一起。作者使用了分子量、LogP、QED、SA和药效团相似性评分(SCRDKit)的属性作为条件向量。SCRDKit是一种描述药效团相似性评分的指标,其可以分解为颜色相似性和形状相似性两个RDKit函数的和。颜色相似性函数根据药效团特征的重叠对两个3D构象进行打分,而形状相似性则是通过简单的形状比较来衡量两个构象之间的相似性。

2.3增强生成分子的多样性

为了增强生成分子结构的多样性,作者引入了“骨架记忆单元”的概念。计算原始分子和新分子之间的Murcko骨架的相似性系数。如果新采样批次中的分子与原始采样批次中的分子相似度达到了80%,则会限制该分子的生成。

实验结果

3.1基于DRD3的生成模型优化过程

针对DRD3靶点,当将CVAE的条件设置为(MW、LogP、QED、SA、SCRDKit)=(、3.2、0.67、0.7、0.6)时,生成器在各项指标表现良好。

表1CVAE生成分子的评估

表1显示了对生成分子的性质的评估,其分子量、LogP、SA分数和QED的平均值接近预定义的阈值。但是,模型也生成了一些奇怪的分子结构,例如10元杂环化合物和有其他高毒性概率的结构(如图2所示)。因此,仅基于药效团匹配得分评估化合物是不足以保证生成的分子具有潜在活性。

图2CVAE生成的具有奇怪结构的分子,约束条件由MW、LogP、SA、QED和SCRDKit组成

为了提高生成分子结构的多样性和靶相关生物活性,CVAE模型加入了对接打分(基于AutoDockVina),构建了CVAE+BO。为了更好地生成具有预期性质的新化合物,CVAE+BO中进一步引入了骨架记忆单元的概念,构建了COMG。由图3所示,基于CVAE+BO模型生成分子的化学空间与训练集中的化合物的重叠面积较大,表明骨架记忆单元的添加使COMG在生成新化合物方面更好。

图3(A)CVAE+BO和(B)COMG模型生成分子和训练集分子的化学空间分布

此外,在亲和力方面,COMG模型生成的分子落在低对接分数区域的比例最大(图4),表明COMG可以通过结合药效团和对接分数约束来生成具有更强结合亲和力的化合物的比例。

图4通过CVAE+BO、CVAE和COMG在DRD3靶点对接分数范围内生成的分子比例

3.2与其他模型评估

在这项工作中,作者以MOSES指标作为模型基准,评估COMG和近期也使用对接评分为约束条件的生成模型,如SBMolGen、OptiMol和REINVENT。结果如表2表示,COMG表现综合良好,特别是具有更高的内部多样性。

表2模型性能评估

为了进一步比较生成分子的性质,作者选择了与COMG最为相似的OptiMol模型进行比较。结果如图5所示,COMG生成的分子具有更好的类药性和更高的可合成性,药效团评分和对接评分与训练数据集相似,略好于OptiMol。因此,COMG在保持良好结构多样性的同时,生成的分子具有更高的质量和更大的潜力,在新药设计任务中具有优势。

图5由COMG和OptiMol生成的分子与训练集分子在一些分子性质上的分布对比

结论

在本研究中,作者结合3D药效团信息、分子对接打分和其他类药性性质,开发了一种分子生成模型COMG,该模型基于有条件的变分自编码器,并通过贝叶斯优化进行了微调。采用骨架记忆单元的思想解决了生成分子的结构相似性高的问题。COMG在多样性方面略优于其他加入对接打分的生成方法。尽管COMG限制的条件比其他的条件生成模型多,但它可以生成具有更好的结构多样性和更高的潜在靶相关生物活性的分子。

参考文献

YangY,HsiehCY,KangY,HouT,LiuH,YaoX.DeepGenerationModelGuidedbytheDockingScoreforActiveMolecularDesign.JChemInfModel.;10./acs.jcim.3c.doi:10./acs.jcim.3c

代码



转载请注明:http://www.shijichaoguyj.com/wxjq/12876.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: