SE(3)等变神经网络DeepTernary精准预测靶向蛋白降解三元复合物结构

【字体: 时间:2025年07月02日 来源:Nature Communications 14.7

编辑推荐:

  本研究针对靶向蛋白降解(TPD)领域的关键瓶颈——PROTACs和分子胶降解剂(MGD)诱导的三元复合物结构预测难题,开发了基于SE(3)等变编码器的深度学习模型DeepTernary。通过构建大规模TernaryDB数据集,该模型在未接触已知PROTAC结构的情况下,对PROTAC基准测试达到DockQ 0.65的顶尖性能,并能预测埋藏表面积(BSA)与降解效力的相关性,为TPD药物设计提供了高效计算工具。

  

在药物研发领域,靶向蛋白降解(TPD)技术正掀起一场革命,特别是蛋白水解靶向嵌合体(PROTACs)和分子胶降解剂(MGDs)的出现,为传统"不可成药"靶点带来了希望。然而这些降解剂发挥作用的关键——由E3泛素连接酶、靶蛋白和小分子降解剂组成的三元复合物结构,却成为制约理性设计的瓶颈。现有实验方法如X射线晶体学和冷冻电镜不仅耗时费力,传统计算预测方法也面临构象采样效率低、精度不足等挑战。

中国人民大学等机构的研究团队在《Nature Communications》发表的研究中,开发了名为DeepTernary的深度学习框架。该研究通过构建包含22,303个三元复合物的TernaryDB数据集,创新性地采用SE(3)等变图神经网络和基于查询的解码器,实现了对PROTAC和MGD诱导复合物结构的精准预测。模型在未见过的PROTAC测试集上达到DockQ 0.65的领先水平,预测时间仅需数秒,且计算的埋藏表面积与实验降解效力显著相关,为加速TPD药物发现提供了强大工具。

关键技术包括:1) 从PDB数据库筛选构建TernaryDB训练集;2) SE(3)等变编码器处理蛋白质-配体相互作用;3) 基于注意力的口袋点解码器预测复合物构象;4) 多初始构象采样策略;5) 埋藏表面积计算评估降解效力。

主要研究结果

TernaryDB数据集构建
研究团队从PDB中筛选46,797个潜在三元复合物,经严格质量控制(分辨率≤3.5 ?,R-free≤0.26)得到22,303个高质量复合物。数据集涵盖363个物种来源的蛋白质和多样化的配体化学空间,通过序列相似性聚类确保训练集与测试集无重叠。

DeepTernary模型架构
模型创新性地将三元复合物拆解为三个组分(蛋白1、配体、蛋白2)的图表示,通过共享权重的SE(3)等变编码器处理几何特征。对于PROTAC采用已知口袋的非结合结构,而MGD则使用结合结构进行盲对接。独特的提示引导口袋点解码器(PPPD)实现了对蛋白-配体相互作用界面的精准预测。

模型设计有效性验证
在验证集上,新型PPPD解码器使中高质量预测(DockQ>0.49)比例显著提升。研究发现单头注意力在坐标预测中优于多头结构,增加潜在嵌入维度(特别是对MGD)和适度噪声都能提升性能。对柔性PROTAC分子采用40个初始构象采样,而刚性MGD仅需单次预测。

PROTAC复合物预测性能
在22个PROTAC测试复合物上,DeepTernary平均DockQ达0.65,显著优于传统方法(RosettaDock-based方法0.44)。对含不同PROTAC的6W7O和6W8I复合物,模型准确捕捉了结构差异。预测的CRBN-BTK复合物BSA与实验降解效力呈现显著相关性,验证了计算结果的生物学意义。

MGD复合物预测突破
针对94个MGD测试复合物,模型平均DockQ达0.21,远优于蛋白-蛋白对接工具EquiDock(0.04)。研究将MGD复合物分为两类:Group1涉及结构域-结构域相互作用,Group2涉及序列模体-结构域相互作用。结果显示Group2预测更优,可能与训练集覆盖度有关。

BSA与降解效力关联
分析预测结构发现,PROTAC的BSA在1100-1500 ?2范围内与降解效力正相关。对VHL-SMARCA2系统,高BSA对应强降解能力;而CRBN-BTK系统中,中等长度连接链的PROTAC(5-11)通过减少原子冲突实现最佳降解效果,揭示了不同靶点组合的差异化设计原则。

计算效率优势
相比传统方法需数小时的计算,DeepTernary在GPU上仅需6.48秒完成PROTAC预测,MGD预测更可在1秒内完成,实现了数量级的效率提升。

这项研究通过深度学习突破了TPD领域的三元复合物预测瓶颈,其重要意义体现在三方面:技术上,SE(3)等变架构和新型解码器为复杂生物分子相互作用建模提供了新范式;应用上,模型可直接指导PROTAC/MGD的理性设计,通过BSA等指标预判降解效力;方法论上,证明非PROTAC训练集可泛化至TPD特定场景,缓解了数据稀缺难题。未来通过整合更多低分辨率数据和序列到结构预测能力,将进一步拓展该框架在TPD药物发现中的应用边界。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号