SCAGE:开启分子特性预测新征程,助力药物研发破局

【字体: 时间:2025年05月13日 来源:Nature Communications 14.7

编辑推荐:

  在药物研发中,结构 - 活性悬崖及药物特性难估等问题阻碍重重。研究人员开展 “自构象感知图 Transformer(SCAGE)用于分子特性预测” 研究,结果显示 SCAGE 性能卓越,能助力揭示定量构效关系(QSAR),加速药物发现进程。

  在药物研发的漫漫长路上,一直存在着诸多棘手难题。结构 - 活性悬崖频繁出现,就像一道道难以跨越的沟壑,让研发进程充满坎坷;而药物的各种特性难以准确预估,犹如迷雾笼罩,使得研发人员在探索新药的道路上举步维艰。要知道,药物研发本就是一个烧钱又耗时的过程,90% 的候选药物会在临床试验阶段折戟沉沙,主要原因就是实验成本高昂,且药物的生物医学特性不够理想。在这样的困境下,为了能找到新的突破口,山东大学软件学院等机构的研究人员展开了深入研究。他们提出了自构象感知图 Transformer(SCAGE),这一创新性的深度学习架构,相关研究成果发表在《Nature Communications》上。
研究人员开展的这项研究意义非凡。SCAGE 通过约 500 万类药化合物进行预训练,用于分子特性预测。它就像是为药物研发打造的一把 “精准钥匙”,有望解开药物特性预测的难题,加速新药发现的进程。

为了开展这项研究,研究人员运用了几个主要关键技术方法。首先,将分子转化为分子图数据,利用 Merck 分子力场(MMFF)获取稳定构象,选择最低能量构象进行后续实验。其次,开发了多任务预训练框架 M4,涵盖分子指纹预测、功能基团预测、2D 原子距离预测和 3D 键角预测四个任务。还设计了数据驱动的多尺度构象学习(MCL)模块,以及功能基团注释算法 。

下面来看具体的研究结果:

  • SCAGE 框架:采用预训练 - 微调范式,预训练模块将分子转化为图数据并获取稳定构象,用改进的图 Transformer 结合 MCL 模块学习多尺度构象分子表示,通过四个预训练任务和动态自适应多任务学习策略优化模型;微调模块在分子特性和活性悬崖任务上微调模型123
  • 性能比较:在 9 个分子特性基准数据集上,SCAGE 对比多种先进方法,在支架拆分评估中,在 8 个数据集上表现最佳;随机支架拆分评估中,在所有数据集上性能最优。在活性悬崖预测任务中,SCAGE 在 30 个数据集上相比基线模型表现卓越45
  • MCL 模块有效性:通过在不同尺度分子构象上的对比研究,发现基于 3D 构象距离且阈值组合在 20% - 60% 时模型学习能力最佳,MCL 模块能有效捕获分子空间结构信息67
  • 预训练任务的影响:综合四个预训练任务能使 SCAGE 性能最佳,不同预训练任务相互补充。通过对分子表示学习能力的评估,发现使用全部四个预训练任务时模型判别能力最强89
  • 基于注意力的可解释性分析:SCAGE 利用注意力分数建立分子结构与活性的联系,能识别敏感子结构,解释活性悬崖现象,原子级功能基团任务有助于模型更准确分析分子特性1011
  • 药物 - 靶点结合预测案例研究:以 BACE 数据集为例,SCAGE 计算的原子权重可反映分子与靶点的对接分数,实验结果表明其能有效识别对靶蛋白敏感的分子结构1213

研究结论和讨论部分再次强调了 SCAGE 的重要意义。它融合了分子构象和空间信息,通过多任务学习预训练方法和独特策略,在各类基准数据集和药物发现任务中表现出色,优于多个竞争基线。消融研究也验证了关键模块的有效性 。不过,SCAGE 也存在一些局限性,比如 MCL 模块的统一度量可能不适用于所有分子,MMFF 力场计算的构象不够精确等。但这并不影响其在药物研发领域的巨大潜力,为后续研究指明了方向,激励科研人员进一步探索优化,推动药物研发迈向新高度。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号