
-
生物通官微
陪你抓住生命科技
跳动的脉搏
融合蛋白结构预测新突破:基于窗口化多重序列比对技术的精准预测方法
【字体: 大 中 小 】 时间:2025年07月26日 来源:Computational and Structural Biotechnology Journal 4.5
编辑推荐:
本研究针对嵌合蛋白结构预测准确性不足的问题,开发了窗口化多重序列比对(Windowed MSA)技术。通过独立计算支架蛋白与目标肽段的MSA并进行融合,显著提升了AlphaFold-2/3对融合蛋白结构的预测精度,在65%的测试案例中实现RMSD降低。该研究为人工设计融合蛋白提供了重要技术支撑。
在蛋白质工程领域,人工设计的嵌合蛋白(将不同蛋白功能域进行融合)已成为生物医药研发的重要工具。然而,当前最先进的AlphaFold-2/3等预测系统在面对这类非天然融合蛋白时,其预测准确性却显著下降——这就像给一位擅长拼原版拼图的大师突然塞入混搭的碎片,结果往往不尽如人意。问题的核心在于,传统的多重序列比对(Multiple Sequence Alignment, MSA)方法在处理融合序列时,难以同时兼顾不同功能域的进化信息,导致共进化信号丢失。
为攻克这一难题,研究人员创新性地提出了窗口化MSA技术。该技术突破性地将融合蛋白的支架部分与目标肽段分开进行MSA检索,再通过智能拼接形成完整比对文件。就像为拼图大师分别提供两套完整的参考图纸,使其能同时看清每个功能域的进化轨迹。研究团队选取了SUMO2、GST等4种常用支架蛋白与51个高精度肽段(RMSD<1?)构建408组融合序列测试集,通过分子动力学模拟验证了融合后各结构域仍保持独立折叠的特性。
关键技术方法包括:1)基于50%序列相似度的非冗余肽段数据集构建;2)AlphaFold-2/3和ESMFold3多算法平行预测;3)MMseqs2服务器生成窗口化MSA;4)50ns分子动力学模拟验证结构稳定性。
研究结果
3.1 AlphaFold-3展现最优肽段预测性能
在394个肽段测试集中,AlphaFold-3以90个RMSD<1?的预测结果显著优于AlphaFold-2(34个)和ESMFold3(21个),证实其作为基准模型的可靠性。
3.2 支架环境导致预测准确性普遍下降
当高精度肽段(单独预测RMSD<1?)与支架蛋白融合后,所有预测模型的准确性均出现恶化,N端融合的误差尤为显著(RMSD平均增加2.3倍),暗示传统MSA方法在嵌合序列处理上存在系统性缺陷。
3.3 窗口化MSA技术恢复预测精度
通过独立生成支架与肽段的MSA后拼接,AlphaFold-3在65%的案例中实现严格更低的RMSD值。典型案例如GST-2LG4融合体系,肽段预测RMSD从7.2?降至0.9?,同时pLDDT置信度评分提升15-20个百分点。
这项研究揭示了当前蛋白质结构预测模型在非天然序列上的局限性,并提供了切实可行的解决方案。窗口化MSA技术不仅解决了实验生物学中常见的标签蛋白预测难题,更为多结构域蛋白的精准预测开辟了新路径。值得注意的是,该方法的优势在AlphaFold-3上体现最为显著,这与该模型更强的共进化信号提取能力相呼应。未来研究可进一步探索该方法在预测结构域间相互作用方面的潜力,为理性设计多功能融合蛋白提供更完整的计算框架。论文发表于《Computational and Structural Biotechnology Journal》,为计算结构生物学领域提供了重要的方法论创新。
生物通微信公众号
知名企业招聘