随机突变作为SARS-CoV-2新变种出现的机制
《Virus Research》:Stochastic Mutation as a Mechanism for the Emergence of SARS-CoV-2 New Variants
【字体:
大
中
小
】
时间:2025年11月22日
来源:Virus Research 2.7
编辑推荐:
SARS-CoV-2的进化轨迹预测研究基于spike蛋白突变数据,采用cladogram算法和A-X模型构建分类树,揭示宏观谱系(O、P、Q)的演变规律与随机采样阈值x的关联,并建立线性回归模型预测新谱系出现时间。
SARS-CoV-2,作为一种具有高度变异能力的病毒,其进化轨迹一直是科学界关注的焦点。近年来,随着病毒在人群中持续传播,出现了多个具有不同特征的变异株,例如Alpha、Beta、Gamma、Delta和Omicron等。这些变异株不仅改变了病毒的生物学特性,还对公共卫生政策和全球防疫措施产生了深远影响。为了更好地理解和预测SARS-CoV-2的未来演化趋势,研究人员提出了多种模型和方法,其中一种基于“突变树”(cladogenetic tree)的统计模型,通过整合已知的突变数据和随机生成的突变位点,预测新变异株的出现和其在突变树中的位置。
该研究采用了一种称为“cladogram算法”的方法,结合了两种不同的突变表示方式——四字母表示法和两字母表示法,以构建SARS-CoV-2突变的演化树。四字母表示法用于描述病毒突变,其中每个字母代表特定的突变类型。具体而言,0表示与野生型无差异,1表示对ACE2受体结合能力影响较小的突变,2表示增强ACE2结合能力的突变,3表示减弱ACE2结合能力的突变。这种表示方式有助于更精确地捕捉突变对病毒功能的影响。而两字母表示法则作为一种简化手段,仅使用0和1来表示突变,忽略2和3,从而降低了计算复杂度。
在构建演化树的过程中,研究团队利用了“n-mer距离算法”,这是一种基于突变位点之间联合概率差异的计算方法。通过将不同变异株的序列进行比较,可以量化它们之间的演化距离,进而构建出一个反映病毒突变关系的树状结构。这一方法的优势在于,它不仅适用于长度相同的序列,还能处理长度不同的序列,确保了分析的广泛适用性。通过多次迭代计算,研究团队发现,当n值增加到7以上时,演化树的结构趋于稳定,能够更准确地反映病毒的演化规律。
在演化树的基础上,研究团队进一步开发了一种统计模型,称为A-X模型。该模型通过将已知的突变位点集合A与随机生成的突变位点集合X进行组合,预测新变异株的出现。在模型中,集合A包含已知的突变位点,而集合X则代表随机生成的突变位点。两者的交集被定义为集合Y,其中包含y个共同的突变位点。通过分析这些集合之间的关系,研究团队发现,新变异株在演化树上的位置主要由x值决定,即随机生成的突变位点数量。随着x值的增加,不同宏观演化分支(macro-lineage)之间的主导地位会发生变化,例如O分支会取代N分支,P分支会取代O分支,而Q分支则可能取代P分支。
通过大规模的随机抽样,研究团队预测了不同宏观演化分支的出现时间及其主导地位的变化趋势。例如,当x值达到一定阈值时,新的宏观演化分支开始显现。具体而言,对于25个已知变异株的集合,当x值小于18时,新变异株主要属于N分支;当x值在18到29之间时,新变异株可能属于N或O分支;当x值超过29但不超过36时,新变异株主要属于O分支;当x值在36到69之间时,新变异株可能属于O或P分支;而当x值超过69时,新变异株则主要属于P分支。随着更多变异株被纳入分析,x值的阈值也会相应调整,例如在36个变异株的集合中,当x值在39到62之间时,新变异株可能属于O或P分支,而当x值超过62但不超过72时,新变异株主要属于P分支;当x值超过72但不超过112时,新变异株可能属于P或Q分支;而当x值超过112时,新变异株则主要属于Q分支。
此外,研究团队还发现,不同宏观演化分支的出现时间与突变位点的数量之间存在一种近似线性关系。通过对已知变异株的初始全球采样日期与突变位点数量进行线性回归分析,他们发现,突变位点数量随时间呈线性增长趋势,且该趋势在不同宏观演化分支之间存在一定的连续性。这一发现为预测新宏观演化分支的出现时间提供了理论依据。例如,基于线性回归模型,研究团队预测了Q分支的出现时间,认为其可能在2025年2月至12月之间出现,并可能在随后的22至24个月内经历一次较大的爆发。
值得注意的是,该研究还通过回顾性测试(backtesting)验证了其模型的可靠性。他们利用2021年之前的数据,成功预测了Omicron(O)分支的出现,这表明模型在实际应用中具有一定的前瞻性。同时,研究团队也指出,由于病毒突变受到多种生物因素的影响,例如免疫逃逸压力和ACE2结合能力的变化,实际的演化时间可能与预测结果存在一定的偏差。因此,该模型更多地提供了一种参考框架,帮助科学界更好地理解病毒的演化规律。
研究团队的模型不仅揭示了SARS-CoV-2突变的统计规律,还提供了一种预测未来病毒变异趋势的方法。通过将突变视为一种随机过程,他们构建了一个能够模拟新变异株出现的统计框架。这一方法的优势在于,它不需要依赖于复杂的生物机制或实验数据,而是基于已知突变信息和随机抽样,从而降低了预测的复杂性和不确定性。此外,该模型还能够适应不断更新的突变数据,确保预测结果的实时性和准确性。
在实际应用中,该模型可以用于指导公共卫生政策的制定。例如,通过预测未来可能出现的宏观演化分支及其主导时间,政府和医疗机构可以提前做好应对准备,包括疫苗研发、流行病监测和防控措施的调整。同时,该模型也为病毒学研究提供了新的视角,帮助科学家更深入地理解病毒的演化机制及其与宿主免疫系统之间的相互作用。
尽管该模型在预测病毒演化方面表现出一定的有效性,但它仍然存在一些局限性。首先,病毒的突变过程受到多种因素的影响,包括环境压力、宿主免疫反应和病毒自身的复制机制。因此,模型的预测结果可能无法完全反映现实情况。其次,该模型主要依赖于已知的突变数据,而新出现的变异株可能会带来新的突变模式,从而影响模型的准确性。此外,突变的随机性可能导致预测结果的不确定性,尤其是在突变位点数量较少的情况下,模型的预测能力可能受到限制。
综上所述,这项研究通过构建突变树和引入A-X模型,为预测SARS-CoV-2的未来演化趋势提供了一种新的方法。该模型基于突变的统计规律,结合了已知突变信息和随机抽样,能够预测新变异株的出现及其在演化树中的位置。同时,该模型还能够根据突变位点数量与时间的关系,推测不同宏观演化分支的出现时间。这些发现不仅加深了我们对病毒演化机制的理解,也为未来的病毒监测和防控提供了重要的理论支持。然而,研究团队也指出,模型的预测结果需要结合实际情况进行调整,以提高其准确性和实用性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号