PRosettaC在PROTAC三元复合物结构预测中超越AlphaFold3:动态构象评估揭示蛋白质降解剂设计新范式
《Scientific Reports》:PRosettaC outperforms AlphaFold3 for modeling PROTAC ternary complexes
【字体:
大
中
小
】
时间:2025年10月29日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对靶向蛋白降解领域的关键挑战——PROTAC诱导的三元复合物结构预测精度不足的问题,系统对比了AlphaFold-3(AF3)与PRosettaC两种前沿工具的效能。通过对36个晶体结构基准集的量化分析,发现AF3的全复合物评分易受支架蛋白干扰,而PRosettaC通过化学锚点约束在特定体系中实现更精确的几何预测。创新性引入分子动力学模拟的动态评估框架,揭示部分静态评分较低的PRosettaC模型能与晶体结构的瞬态构象高度匹配。该研究为理性设计PROTAC提供了更全面的计算评估范式,发表于《Scientific Reports》。
在药物研发的前沿领域,靶向蛋白降解(Targeted Protein Degradation, TPD)技术正掀起一场革命。其中,PROTAC(Proteolysis Targeting Chimeras)作为一类双功能分子,能像“分子胶水”一样,一端结合靶标蛋白,另一端招募E3泛素连接酶,形成三元复合物,从而给疾病相关的“坏蛋白”贴上泛素标签,引导其被细胞的蛋白酶体降解。这种策略有望攻克传统难以成药的靶点,比如一些没有明确活性口袋的蛋白质。然而,PROTAC分子的合理设计,极度依赖于对其所形成的三元复合物结构的精确理解。如果无法准确预测靶蛋白、E3连接酶和PROTAC分子三者是如何在空间上组装在一起的,设计高效的降解剂就如同“盲人摸象”。
目前,解析三元复合物结构主要依靠实验方法,如X射线晶体学,但这个过程耗时费力且并非总能成功。因此,计算模拟方法,特别是基于人工智能的结构预测工具,被寄予厚望。AlphaFold3(AF3)作为DeepMind开发的革命性工具,在预测蛋白质结构方面取得了巨大成功,但其在PROTAC这种诱导形成的、非天然的三元复合物上的表现如何?另一个专门为PROTAC设计的工具PRosettaC,其基于物理的约束性建模策略是否更具优势?这些都是领域内亟待回答的关键问题。
为了回答这些问题,来自迈阿密大学等机构的研究团队在《Scientific Reports》上发表了一项系统性研究。他们精心挑选了36个具有晶体结构数据的PROTAC三元复合物作为“金标准”基准集,对AF3和PRosettaC进行了头对头的严格评测。研究不仅进行了常规的静态结构比对,还创新性地引入了分子动力学(Molecular Dynamics, MD)模拟,将预测模型与晶体结构在溶液中的动态构象 ensemble 进行比较,从而提供了一个更为全面和贴近生理状态的评估视角。
研究人员主要运用了几项关键技术方法:首先,他们从蛋白质数据库(PDB)中严格筛选并人工鉴定了36个非冗余、高质量的PROTAC三元复合物晶体结构作为基准。其次,他们分别使用AF3服务器(生成包含支架蛋白的“全复合物”模型和仅含E3与靶蛋白的“最小复合物”模型)和本地部署的PRosettaC(生成多达1000个模型/体系)进行结构预测。然后,他们采用DockQ v2这一经过验证的定量指标来评估预测界面与实验结构之间的结构保真度。最后,他们对晶体结构进行了50纳秒的全原子分子动力学模拟,并将预测模型与模拟轨迹中的数千个动态构象进行帧对帧的DockQ比对,以评估瞬态构象匹配的可能性。
研究发现,AF3在预测包含支架蛋白(如VHL体系的Elongin B/C或CRBN体系的DDB1)的“全复合物”时,DockQ评分往往非常高(接近0.9),但这主要归因于支架蛋白与E3连接酶之间大量且准确的接触,这些接触与PROTAC分子诱导的特异性界面无关。当研究人员将这些“全复合物”模型剥离支架蛋白后,重新评估仅包含E3连接酶和靶蛋白的“核心”界面时,DockQ分数急剧下降,在多数体系中低于0.2。
这表明,AF3“全复合物”的高分存在明显的“虚高”现象。进一步比较AF3“核心复合物”(预测时包含支架,评估时剥离)与“最小复合物”(预测和评估均不包含支架)的表现,发现两者DockQ分布高度重叠,统计检验表明差异不显著。这意味着,在预测时加入支架蛋白对于提升真正的、PROTAC依赖的E3-靶标界面精度贡献甚微。
PRosettaC与AlphaFold-3预测的比较性能
在成功建模的25个体系中,PRosettaC展现出与AF3不同的性能特征。PRosettaC的DockQ得分分布更广,在多个体系(如6BN7, 6ZHC, 7KHH, 8QVU)中产生了明显的高分模型或更高的中位数得分。
累积分布函数图显示,AF3模型的得分高度集中在低分区(<0.2),而PRosettaC则保留了更长的高分尾部,意味着它能更频繁地生成质量“尚可”(DockQ > 0.23)或更高的界面预测。
热图分析表明,PRosettaC在大多数情况下优于AF3最小复合物预测,而AF3核心复合物模型很少能超越PRosettaC。综合排名显示,PRosettaC在近一半(48%)的基准体系中是表现最佳的方法。
然而,PRosettaC也存在局限性,其在36个体系中有11个建模失败,主要原因是连接子采样不足或锚点几何错配。
评估AlphaFold-3预测与动态参考ensemble的匹配度
为了检验AF3预测的构象是否可能对应于溶液中天然三元复合物的某个瞬态状态,研究人员对五个晶体结构进行了MD模拟,并将静态的AF3预测模型与MD轨迹的每一帧进行DockQ比较。结果表明,在所有测试体系中,AF3模型的DockQ得分在整个模拟过程中始终保持在很低水平(通常低于0.1),未见明显的瞬时峰值。
这证实了AF3最小复合物预测的界面与实验观察到的复合物在模拟条件下的动态构象 ensemble 存在较大差异。
对PRosettaC模型进行MD模拟晶体ensemble的DockQ评分
与静态评估只对比单一晶体构象不同,研究人员将PRosettaC生成的最佳模型与对应晶体结构MD模拟产生的动态构象 ensemble 进行比对。这一动态评估策略揭示了静态比较中容易被忽略的“隐藏”兼容性。
例如,对于体系6HAX,其最佳的静态PRosettaC模型DockQ得分低于0.23的“可接受”阈值,但在与MD轨迹比对时,出现了短暂的DockQ峰值(>0.4)。这表明,这些预测模型可能捕获了晶体结构中未被捕捉到、但在溶液中可短暂存在的、具有生物学合理性的瞬态构象。对于像8QVU这样的体系,其最佳PRosettaC模型不仅在静态对比中得分高(0.69),在与MD轨迹比对时也保持了长时间的高对齐度,进一步验证了其构象的合理性。
本研究通过系统性的基准测试表明,在预测PROTAC诱导的三元复合物结构方面,专门化的工具PRosettaC在多数情况下优于通用的深度学习工具AlphaFold-3。AF3虽然能生成整体结构合理的模型,但其预测的E3-靶蛋白界面往往无法容纳PROTAC连接子,且其高分可能被非降解剂相关的支架蛋白接触所夸大。PRosettaC利用化学定义的锚点约束,在条件合适时能产生更接近实验结构的几何模型,但其成功率受限于连接子采样和锚点几何的兼容性。
该研究最重要的创新在于引入了基于分子动力学的动态评估框架。它强有力地证明,传统的、基于单一静态晶体结构的评估方法可能低估了某些计算模型的生物学意义。一些在静态比对中得分不高的PRosettaC模型,实际上能与天然复合物在溶液中采样的瞬态构象高度匹配。这提示我们,三元复合物的功能性界面可能是一个构象动态变化的 ensemble,而非单一刚性结构。因此,未来的计算评估和降解剂设计应更多地考虑蛋白质的柔性。
此外,研究发现PRosettaC内置的Rosetta全原子能量函数与界面精度(DockQ)相关性很弱,这意味着仅依靠能量排名来选择最佳模型可能存在风险,需要结合界面特异性指标或动态评估进行综合判断。
研究的局限性包括数据集偏向于VHL连接酶和溴结构域靶标,AF3服务器对残基数量的限制排除了更大支架蛋白的参与,以及PRosettaC在约30%的体系中建模失败。未来的研究方向应扩大基准集的多样性,开发能更好处理复杂几何和连接子柔性的采样算法,并最终将计算预测与细胞降解活性实验相关联,以验证模型的功能相关性。
总之,这项研究为PROTAC计算建模领域提供了更细致、更可靠的评估范式,强调了结合约束性建模、动态构象采样和功能验证的重要性,将有力推动理性设计靶向蛋白降解剂的进程。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号