Syn-MolOpt:融合合成规划的分子优化新利器,助力药物研发新突破

【字体: 时间:2025年03月04日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  研究人员为解决分子优化算法未充分考虑合成性问题,开展 Syn-MolOpt 研究,结果良好,对药物研发意义重大。

  在药物研发的漫长征程中,寻找具有理想特性的新型分子就像在浩渺的化学宇宙里探寻宝藏。传统的药物研发主要依赖人力,专家们凭借经验设计、合成和评估新分子。这种方式虽然取得了不少成果,但高昂的成本和漫长的时间消耗,严重限制了对化学空间的探索。随着深度学习(DL)技术的兴起,情况有了转机,生成模型在分子设计领域大放异彩,大大提高了寻找最优化合物结构的效率。然而,这些模型仍有不足,能成功找到满足多种预设特性分子的例子少之又少,因此分子优化在药物研发中的重要性愈发凸显。
近年来,基于 DL 的分子优化算法不断涌现,在计算机模拟测试中表现出色。但它们大多有个严重缺陷,就是没有充分考虑分子的可合成性。这意味着优化后的化合物可能在实际合成中困难重重,给后续的实验测试带来巨大挑战。为了解决这个问题,有些研究将合成可及性(SA)分数纳入分子优化算法,但这种方法依赖预先设定的化学规则和启发式规则,不仅预测准确性受限,还无法提供实际的合成路径。

在这样的背景下,浙江大学药学院、澳门理工大学等机构的研究人员 Xiaodan Yin、Xiaorui Wang 等人开展了一项重要研究,相关成果发表在《Journal of Cheminformatics》上。研究人员提出了一种基于功能反应模板的合成规划驱动的分子优化方案 ——Syn-MolOpt(Synthesis planning-driven Molecular Optimization method using data-derived functional reaction templates) ,为药物研发带来了新的希望。

研究人员在开展研究时用到了几个主要关键的技术方法。首先,利用子结构掩码解释方法(SME)构建特定属性的功能反应模板库。通过关系图卷积网络(RGCN)算法训练共识模型,计算子结构对目标属性的贡献值。然后,从开源反应数据集提取反应模板并筛选。在模型构建方面,将化合物的合成路径建模为合成树,以自底向上的方式构建,将其视为马尔可夫决策过程,训练四个神经网络分别预测反应动作、第一反应物、反应模板和第二反应物。在分子优化阶段,结合功能反应模板和遗传算法(GA)对分子进行优化。

下面来看具体的研究结果:

  • 功能反应模板库的设计:以诱变毒性(Mutagenicity,Mutag)为例,研究人员先构建用于属性预测的共识模型,通过 SME 将分子数据集剖析为各种子结构并分配贡献值,得到带有属性值的诱变毒性功能子结构数据集。再从开源反应数据集提取通用的 SMARTS 逆向合成反应模板并转化为正向反应模板,最后经过三步筛选得到功能反应模板库。
  • Syn-MolOpt 的性能测试:研究人员进行了多项多属性分子优化实验,包括两个毒性相关(GSK3β-Mutag 和 GSK3β-hERG)和两个代谢相关(GSK3β-CYP3A4 和 GSK3β-CYP2C19)的优化任务,并与 Modof、HierG2G 和 SynNet 这三个基准模型进行对比。在 GSK3β-Mutag 优化实验中,Syn-MolOpt 在几乎所有指标上优于其他方法,能显著降低分子的诱变毒性(Mutag 分数),同时提高与糖原合酶激酶 3β(GSK3β)的结合亲和力(GSK3β 分数) 。在 GSK3β-hERG 优化任务中,Syn-MolOpt 同样表现出色,有效降低了 hERG 相关的心脏毒性,同时增强了与 GSK3β 的结合亲和力。在代谢性质优化实验中,针对细胞色素 P450(CYP)抑制相关的优化任务,如 GSK3β-CYP3A4 和 GSK3β-CYP2C19,Syn-MolOpt 也取得了较好的结果,能优化分子使其具有更低的代谢抑制特性,同时提高与 GSK3β 的结合亲和力。
  • 真实世界分子优化场景的探索:在真实世界中,用于优化属性的数据往往不足,难以训练出高精度的定量构效关系(QSAR)模型。研究人员模拟这种场景,从 Mutag 和 hERG 毒性数据集的训练集中分别提取 20% 的数据重新训练共识模型,重建功能反应模板库。结果发现,在低精度评分函数的分子优化任务中,Syn-MolOpt 比 SynNet 表现更优,尤其是在毒性优化方面。

研究结论和讨论部分表明,Syn-MolOpt 考虑了分子优化和合成性,为优化的化合物提供参考合成路线。在多个多属性分子优化任务中,它优于基准模型,证明了其有效性和通用性。功能反应模板在分子优化中起到了重要作用,通过合成树生成过程中对相关片段的有效转化,即使在评分反馈不准确的情况下,Syn-MolOpt 也能表现稳健,适用于真实世界的分子优化场景。不过,该方法也有提升空间,如目前仅为单一属性构建功能反应模板库,未来设计更通用的多属性模板库可能进一步提高分子优化性能。总的来说,Syn-MolOpt 为药物研发提供了一种有价值的工具,有望推动药物研发领域的进步,为解决药物研发中的关键问题带来新的思路和方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号