编辑推荐:
该综述聚焦多聚体蛋白质复合物的结构、相互作用、动力学及功能预测,探讨其在疾病机制和药物设计中的意义。分析单体与多聚体预测差异,综述 AlphaFold2/3 等方法进展,展望提升预测精度、功能注释等未来方向,为相关研究提供全面参考。
多聚体蛋白质复合物在生物过程中扮演关键角色,其结构、相互作用、动力学和功能的研究对揭示疾病机制、推动药物设计至关重要。尽管单体蛋白质预测已取得显著进展,但多聚体因结构复杂、理化性质多样及实验数据有限,仍是极具挑战性的研究领域。
多聚体预测的原理与基础方法
蛋白质复合物通过亚基间特异性相互作用形成,其界面的氢键、静电作用等对稳定性和功能至关重要。多聚体预测与单体预测在数据、目标、动力学考量等方面存在显著差异,需整合多维度信息。
数据差异
单体预测聚焦单链折叠,而多聚体需考虑单体折叠状态、复合物组装、相互作用界面等。实验数据匮乏使单体模型难以直接应用于多聚体,需结合高分辨率实验数据与计算方法。
基于序列的共进化分析
共进化分析可揭示蛋白质链间潜在相互作用位点,通过多序列比对分析残基协同突变模式,结合深度学习方法如 AlphaFold-Multimer,显著提升复合物结构预测的准确性和效率。
基于结构的接触预测
接触矩阵是预测复合物组装的重要工具,通过捕捉氨基酸残基间接触信息,支持结构预测。RaptorX-contact、Glinter 等方法利用深度学习预测残基接触,在同型和异型二聚体中表现出不同性能。
分子对接与组装
分子对接通过计算结合界面和结合能预测结合模式,分为刚性和柔性对接。多聚体组装需考虑空间排列、对称性等,蒙特卡罗模拟和分子动力学模拟是常用方法。
基于学习的方法
AlphaFold 系列在蛋白质结构预测中取得突破,AlphaFold3 通过扩散架构提升多生物分子联合结构预测精度。蛋白质语言模型(pLMs)如 protTrans 助力序列分析,与结构预测结合推动孤儿蛋白建模。
蛋白质相互作用分析
早期方法聚焦相互作用残基对预测,近年几何深度学习如 MaSIF 框架为相互作用机制研究提供新视角。STRING、PINA 等数据库揭示蛋白质相互作用网络,助力功能分析。
质量评估分类
传统评估指标包括模板分数(TM-score)、界面均方根偏差(iRMSD)等,CASP16 引入多维评分指标,综合评估结构折叠质量、界面接触和局部准确性,推动多聚体预测方法优化。
多聚体结构、动力学与功能预测
AlphaFold2 和 AlphaFold3 革新了计算蛋白质预测,但在大复合物、无序区域等预测中仍存挑战。CASP16 提出未知化学计量比、超大型复合物等难题,PreStoi 等方法结合同源模板提升预测准确性。
结构预测进展
AlphaFold-Multimer 在化学因子 - 受体复合物预测中表现优异,AF2Complex、SymProFold 等方法拓展其应用。然而,抗体 - 抗原复合物等复杂体系仍需结合实验数据优化,如冷冻电镜(cryo-EM)与 AlphaFold 结合的 EModelX 方法。
功能预测与相互作用分析
蛋白质功能与其相互作用网络密切相关,AlphaFold-Multimer 结合生物物理实验验证相互作用界面。DeepInter、SpatialPPI 等工具利用深度学习预测残基接触,IDBindT5 聚焦无序区域结合位点预测,为功能注释提供新工具。
动力学预测
蛋白质动力学分析是连接结构与功能的桥梁,PAthreader、Cfold 等方法探索构象空间,DynamicBind 利用扩散网络模拟配体结合构象变化。内在无序蛋白(IDP)的动力学预测依赖多方法整合,如 AlphaFold 与分子动力学模拟结合。
多聚体质量评估
多聚体预测质量评估涵盖结构和功能评估,CASP16 采用 GDT_TS-like、TM-score 等指标评估全局拓扑,DockQ-wave、QS 评分评估界面接触,PatchDockQ 等评估局部准确性。深度学习方法如 DProQA、GCPNet-EMA 提升评估精度,但大体系预测、动态信息整合等仍存挑战。
结论与展望
AlphaFold 系列推动蛋白质结构预测革命,但在非球形蛋白、动态构象等预测中需进一步优化。未来需整合多源数据、提升算法效率,结合实验验证,以更精准揭示多聚体蛋白质的奥秘,推动药物设计和生物医学研究发展。