基于突变-选择模型的蛋白质位点替代速率精准预测新方法

《Scientific Reports》:Accurate prediction of substitution rates at protein sites with a mutation-selection model

【字体: 时间:2025年10月03日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对传统系统发育方法在预测蛋白质位点替代速率时存在的局限性,开发了一种基于突变-选择模型(mutation-selection model)的新方法。该方法结合简单核苷酸替代模型,仅需多重序列比对(MSA)数据即可快速准确计算位点特异性替代速率,在模拟数据和真实数据中均表现出优异性能,且对浅层MSA具有鲁棒性,为研究蛋白质进化机制和功能约束提供了新工具。

  
蛋白质是生命的执行者,它们的进化过程蕴含着丰富的生物学信息。通过分析蛋白质序列中不同位点的氨基酸替代模式,研究人员能够揭示这些位点在蛋白质稳定性、结构和功能中的重要程度。然而,准确预测单个位点的进化速率一直是个挑战。
传统方法主要采用现象学模型,通过位点特异性速率因子来缩放蛋白质的整体替代速率。这些模型虽然在一定程度上改进了系统发育树的推断,但由于它们假设所有位点的氨基酸偏好性相同,且进化过程主要在氨基酸水平建模,与实际的核苷酸水平进化过程存在脱节,可能导致有偏差的预测。
为了更真实地描述位点异质性,瑞典隆德大学Ingemar André教授团队在《Scientific Reports》上发表了一项研究,开发了一种基于突变-选择模型的新方法,能够直接从氨基酸序列数据中准确预测位点特异性替代速率。
这项研究的创新之处在于将突变-选择模型与核苷酸突变模型相结合,仅使用多重序列比对信息即可快速计算位点速率,无需进行耗时的系统发育树推断。该方法不仅计算效率高,对浅层序列比对也表现出良好的鲁棒性。
关键技术方法
研究采用突变-选择框架,结合K80核苷酸替代模型参数(κ=1.4)和多核苷酸突变率参数(ρ=0.2),通过最大似然法优化模型参数。利用从Pfam数据库获取的3912个多重序列比对进行模型训练,并通过59个TreeBase比对进行验证。采用基于结构的进化动力学模拟(RosettaEvolve)生成四个测试蛋白质(Barnase、Ribonuclease T1、Lysozyme、CI2)的基准数据,将预测速率与真实替代计数进行相关性分析。
结果
氨基酸速率来自突变-选择模型
研究发现,通过将密码子水平的突变-选择模型凝聚为氨基酸水平的瞬时速率矩阵,可以准确计算位点特异性替代速率。该方法的核心是将氨基酸频率分布与替代速率联系起来,通过计算位点总通量来估计替代速率。
ij)与MutSel中相同元素的对比。黑线为线性拟合。r2值JTT为0.89,WAG为0.83,LG为0.79。'>
模型参数的最大似然估计
通过网格搜索确定最优参数组合κ=1.4和ρ=0.2。研究发现模型对κ的变化不敏感,而对ρ有明确的最优值。由此得到的MutSel速率矩阵与经验矩阵JTT、WAG和LG高度相关。
蛋白质序列数据的模拟
通过基于结构的进化动力学模拟验证模型性能,结果显示突变-选择模型预测的速率与真实替代计数具有极强的线性相关性,r2值在0.90-0.94之间,优于传统系统发育方法LEISR的0.87-0.92。
MSA深度对速率预测的影响
研究表明,突变-选择模型仅需50条序列即可达到最佳预测效果,即使使用30条序列,r2值仍可达0.8左右,显著优于需要125条以上序列的传统方法。
与经验数据的比较
在213个真实蛋白质序列比对上的测试表明,突变-选择模型预测的速率与rate4site方法的结果高度相关(平均r2为0.74),证明该方法在真实数据中同样有效。
经验替代矩阵的解构
研究还展示了如何将经验替代矩阵解构为位点平衡频率向量的集合,揭示了不同矩阵隐含的位点变异性假设。JTT矩阵对应更广泛的位点变异性,而LG矩阵包含更多高度保守的位点。
eff)直方图。'>
研究结论与意义
该研究开发的突变-选择模型方法为蛋白质位点替代速率的预测提供了快速、准确的解决方案。与传统系统发育方法相比,该方法不假设所有位点具有相同的氨基酸偏好性,更符合实际进化过程,且计算效率显著提高。该方法能够处理大规模序列数据,对浅层比对具有鲁棒性,为研究蛋白质功能重要性和进化约束提供了有力工具。
通过建立位点频率分布与替代矩阵之间的联系,该研究还深化了我们对经验替代矩阵背后生物学意义的理解。突变-选择模型框架为探索蛋白质进化机制开辟了新途径,有望在蛋白质设计、功能注释和进化分析等领域发挥重要作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号