
-
生物通官微
陪你抓住生命科技
跳动的脉搏
共折叠技术:预测变构与正构配体的药物对接新范式
【字体: 大 中 小 】 时间:2025年07月01日 来源:Artificial Intelligence in the Life Sciences CS5.0
编辑推荐:
为解决蛋白质-配体相互作用预测中变构位点识别难题,研究人员采用NeuralPLexer、RoseTTAFold All-Atom和Boltz-1x三种共折叠方法,对17组正构/变构配体数据集进行系统性评估。研究发现Boltz-1x在配体质量验证中通过率达90%,但现有方法普遍偏向训练数据丰富的正构位点识别。该研究为优化AI驱动的药物设计提供了关键基准。
在药物研发领域,准确预测蛋白质与配体的相互作用模式是结构生物学和计算化学的核心挑战。传统方法如X射线晶体学和冷冻电镜虽能解析结构,但耗时长、成本高。随着AlphaFold等深度学习算法的突破,仅凭氨基酸序列即可预测蛋白质结构,这一技术现已进阶至"共折叠"(co-folding)阶段——直接从序列预测蛋白质-配体相互作用。然而,对于变构(allosteric)位点的预测仍存在显著瓶颈,这类位点远离蛋白质活性中心,却能通过远程构象变化调控功能,是新药开发的重要靶点。
针对这一挑战,研究人员在《Artificial Intelligence in the Life Sciences》发表的研究中,系统评估了三种前沿共折叠方法:MIT开发的Boltz-1/Boltz-1x、Nvidia的NeuralPLexer和Baker实验室的RoseTTAFold All-Atom。研究团队选取17组包含正构(orthosteric)和变构配体的蛋白质复合物数据集,通过PoseBusters工具严格验证预测质量,并创新性地采用双配体策略增强变构位点识别。
关键技术方法包括:1)基于Xie等报道的数据集进行优化,筛选17种蛋白质的40个配体(20正构/20变构);2)使用三种共折叠方法生成预测结构,其中Boltz-1x运行5次以评估重现性;3)通过PoseBusters检查配体化学合理性;4)计算配体质心距离(COM)和均方根偏差(RMSD)量化预测准确性;5)分析蛋白质数据库(PDB)中配体位点出现频率与预测成功率关联。
蛋白质结构预测与配体放置
全局蛋白质结构预测中,Boltz-1x和RoseTTAFold对60%以上蛋白的RMSD<2.5?,而NeuralPLexer仅13%。雄激素受体(AR)案例显示,非结晶区域的预测构象差异显著(图2),揭示方法对已知结构区域的依赖性。
配体RMSD预测
正构配体平均RMSD约3?,但变构配体普遍>10?。以PTK2为例(图3),正构配体能准确定位,而变构配体被错误放置在正构位点,表明训练数据偏差对预测的显著影响。
相对配体位置评估
COM分析显示,33%变构配体被误置于正构位点(COM<2.5?),66%位于正构位点附近(COM<5?)。葡萄糖激酶(GCK)因PDB中变构配体数据丰富,成为少数预测成功的案例(图5)。
化学有效性验证
PoseBusters检测显示Boltz-1x配体合格率达98.5%,显著优于NeuralPLexer(6.6%合格)和RoseTTAFold(15%合格)。严格标准下,80%预测配体仍存在化学不合理问题。
双配体策略突破
输入两个相同变构配体时,Boltz-1x对50%案例能正确识别变构位点(图8)。如AR蛋白中,双配体预测成功将变构配体2yhd定位于正确位点(RMSD<2.5?),而2ylo虽定位正确但取向偏差(图9)。
这项研究揭示了共折叠方法的当前局限与突破方向:1)变构位点预测成功率与训练数据丰度正相关;2)Boltz-1x在化学合理性上表现最优;3)双配体策略可增强变构位点采样。尽管这些方法尚未完全替代传统分子对接或自由能微扰(FEP),但其展现的潜力预示着计算药物设计的范式转变。未来通过整合物理评分函数和构象系综优化,共折叠技术或将成为解锁"不可成药"靶点的关键。
生物通微信公众号
知名企业招聘