AlphaFold预测折叠蛋白质侧链构象:能力评估与协同突变的结构探索

【字体: 时间:2025年09月21日 来源:Biophysical Journal 3.1

编辑推荐:

  AlphaFold虽能精准预测蛋白质整体结构,但其侧链构象预测能力尚不明确。本研究评估ColabFold与AlphaFold3在侧链二面角(χ1-χ3)预测的准确性,发现误差随角度复杂度增加(χ1约14%,χ3约48%),且存在对常见旋转异构体的偏好。通过整合Potts模型与AlphaFold,开发出探索突变-结构协同变化的新工具,为蛋白质设计提供新思路。

  

蛋白质是生命活动的主要执行者,其功能很大程度上取决于其三维结构。准确预测蛋白质结构一直是生物物理和计算生物学领域的圣杯。近年来,DeepMind开发的AlphaFold人工智能系统在蛋白质结构预测领域取得了突破性进展,能够仅从氨基酸序列高精度地预测蛋白质的整体三维骨架结构,对结构生物学产生了革命性影响。然而,在分子建模的实际应用中,蛋白质侧链的精确构象同样至关重要,它直接影响蛋白质与配体的结合、酶催化活性以及蛋白质-蛋白质相互作用等。一个关键问题随之产生:AlphaFold在准确预测蛋白质整体结构的同时,能否同样精确地预测每个氨基酸残基侧链的构象?这正是Gia G. Maisuradze及其团队在发表于《Biophysical Journal》上的研究中所探讨的核心问题。

为了回答这个问题,研究人员系统性地评估了AlphaFold在线实现平台ColabFold以及新发布的AlphaFold3在预测折叠蛋白质内部侧链构象方面的能力。他们的研究不仅停留在准确性评估,更进一步地将AlphaFold与先进的序列能量模型相结合,探索了其在研究协同突变引起的结构变化中的应用潜力。

本研究主要采用了以下几项关键技术方法:1)使用ColabFold和AlphaFold3对一组10种代表不同高 populated折叠家族的基准蛋白质(Set A)进行结构预测,这些蛋白质均包含在AlphaFold蛋白质结构数据库中;2)对另一组10种新发布的、未参与AlphaFold2训练集的蛋白质结构进行预测以验证泛化能力;3)采用基于序列的Potts统计能量模型对ABL1和PIM1激酶进行大规模突变扫描,寻找强协同作用的突变对;4)利用ColabFold预测这些协同突变对侧链相互作用的结构特征,整合形成一条全新的研究管线。

研究结果

侧链构象预测准确性

研究人员发现,在Set A基准蛋白上,ColabFold预测侧链构象的误差随着二面角复杂度的增加而显著上升。对于第一个二面角χ1,预测误差约为14%,而对于更复杂的χ3二面角,误差则增大至约48%。这表明尽管AlphaFold在整体结构预测上表现出色,但在侧链细节,特别是柔性较大的侧链末端构象预测上仍面临挑战。

氨基酸类型与结构模板的影响

研究进一步揭示了预测准确性的差异性。非极性侧链由于其构象选择受到的空间约束更多,其预测误差相对较小。此外,使用结构模板(templates)能够在一定程度上改善预测结果,为提高预测精度提供了可行路径。

旋转异构体偏好性

一个重要的发现是,ColabFold表现出对蛋白质数据库(Protein Data Bank, PDB)中最普遍存在的旋转异构体状态(rotamer states)的明显偏好。这种偏向性可能限制了该工具有效捕捉罕见但功能重要的侧链构象的能力,这是在利用其预测结果进行功能推断时需要考虑的因素。

泛化能力验证

为了测试模型的泛化能力,研究团队评估了ColabFold对一组未参与AlphaFold2训练的新发布蛋白质结构的预测性能。结果显示,其预测侧链构象的准确性与在Set A上的表现几乎相同,证明了该工具在面对全新序列时仍保持稳定的预测能力。

AlphaFold3的改进

本研究还初步比较了AlphaFold3的表现,发现其侧链预测精度略优于ColabFold,显示了AlphaFold系列模型的持续进化与改进。

Potts模型与AlphaFold的整合应用

作为方法学应用的一个范例,研究人员将基于序列的Potts统计能量模型与AlphaFold整合到一个统一的工作流中。他们对ABL1和PIM1这两种激酶进行了大规模突变扫描,搜寻其中协同作用最强的突变对。随后,他们利用ColabFold预测了这些协同突变对侧链相互作用所带来的结构变化特征。这个案例成功地展示了一种强大的新方法,可用于探索蛋白质突变、结构协同变化与功能(fitness)之间的内在联系。

结论与意义

本研究对AlphaFold在侧链构象预测方面的能力进行了全面而深入的评估。结果表明,尽管AlphaFold及其衍生工具在预测蛋白质整体结构上取得了巨大成功,但其在侧链原子级别细节的预测上仍存在局限,特别是对于复杂的χ角预测误差较大,且对常见rotamer存在系统性偏好。这一发现对于分子建模领域具有重要的警示意义,提示研究人员在依赖AlphaFold预测结果进行诸如药物设计、酶活性位点分析等精细应用时,需要审慎对待其侧链构象的预测结果。

更重要的是,本研究开创性地将序列基础的Potts模型与结构预测的AlphaFold工具整合起来,构建了一条全新的研究管线。这种整合使得研究人员能够不仅仅停留在预测静态结构,而是可以大规模地探索突变如何通过协同效应影响蛋白质的结构重排,进而影响其功能。这为理解蛋白质基因型-表型关系、指导蛋白质工程和理性药物设计提供了强有力的新工具。综上所述,这项工作不仅客观评估了现有工具的能力边界,更重要的是开拓了将序列协变信息与AI结构预测相结合的新研究方向,为最终实现从序列精准预测蛋白质结构与功能的全过程迈出了关键一步。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号