
-
生物通官微
陪你抓住生命科技
跳动的脉搏
宿主转换过程中病毒进化速率变化的系统发育树定根与定年新方法及其在SARS-CoV-2起源研究中的应用
【字体: 大 中 小 】 时间:2025年07月08日 来源:Genome Biology and Evolution 3.1
编辑推荐:
本研究针对病毒宿主转换(H1→H2)导致的进化速率(r)变化问题,开发了基于S型函数(r(T)=α+β/(1+e-ρ(T-Tm)))的TRAD算法,成功应用于SARS-CoV-2基因组分析,揭示2020年2月下旬D614G谱系驱动的速率上升(r1→r2),并将共同祖先追溯至2019/11/20,为病毒跨种传播机制研究提供新范式。
当病毒跨越物种屏障时,其进化轨迹往往会发生戏剧性改变。SARS-CoV-2从蝙蝠到人类的跨种传播就是典型案例,但传统分子钟方法假设恒定进化速率(r),无法捕捉宿主转换(Host-switching)过程中的动态变化。这个根本性局限导致早期疫情溯源研究出现矛盾结果——部分研究将共同祖先(TA)定位于2019年11月,而大样本分析却指向更早的2019年夏季。这种分歧凸显了发展新方法的迫切性,需要建立能够反映宿主环境差异(H1 vs H2)对病毒进化影响的数学模型。
渥太华大学的研究团队在《Genome Biology and Evolution》发表的研究中,创新性地提出病毒进化速率在宿主转换过程中遵循S型变化曲线。通过整合APOBEC3蛋白介导的突变压力、种群动态改变等生物学机制,建立了包含四个参数(α,β,ρ,Tm)的速率函数r(T),并开发了配套的TRAD软件。应用该方法分析188个早期SARS-CoV-2基因组发现:D614G谱系在2020年2月下旬推动进化速率显著提升,最终将病毒共同祖先精确定位于2019年11月20日,为疫情起源研究提供了更可靠的时间锚点。
研究采用三大关键技术:1) 基于广义逻辑方程构建速率-时间函数模型;2) 最大似然法遍历系统发育树所有可能根位点;3) 似然比检验比较恒定速率与S型速率模型的拟合优度。样本来自Rambaut(2020)研究的189个全长基因组,经严格质控后保留188个,通过PhyML构建GTR+T模型下的最大似然树。
【进化速率模型构建】
研究突破性地将病毒宿主转换过程建模为S型曲线,参数α代表原宿主(H1)的基础速率,β表示最大速率变化幅度,(α+β)对应新宿主(H2)的稳定速率。关键参数ρ控制变化方向与速度:正值(如SARS-CoV-2的0.5)表示速率加速,负值表示减速。该模型成功解释了为何早期小样本研究(2020年2月前)支持恒定速率,而包含后期样本的分析必须考虑速率变化。
【SARS-CoV-2实证分析】
对TREE188的分析显示:2020年2月21日(Tm)后进化速率显著提升7倍,从0.00000159突变/位点/天(12月24日)增至0.00001173(3月4日)。这种变化主要源自D614G谱系,其根-尖距离(D)增长趋势明显强于其他谱系。速率变化使谱系分化时间估算产生重大差异——按后期高速率计算,A/B谱系分化仅需3天;而按早期低速率则需22天。
【系统发育重估】
与传统认知不同,S型速率模型支持A/B谱系为姐妹群关系,而非A谱系更古老。研究指出早期基因组中241/3037/14408/23403位点的TT/CC/CT/TC多态性分布,不能简单作为判定谱系古老的依据。值得注意的是,中国2020年1月分离的6个D614G毒株呈现TTCG而非主流TTTG模式,提示早期存在更复杂的谱系分化。
研究结论揭示病毒宿主转换会引发进化速率剧变,这既可能通过APOBEC3介导的突变风暴导致"穆勒齿轮"(Muller's ratchet)效应清除劣势毒株,也可能催生D614G等适应性变异。该发现为"单次人畜共患假说"提供了新支持——速率变化可解释短期内观察到的遗传多样性,无需假设多次跨种传播。TRAD方法的应用将促进HIV、流感等其他病毒的人畜共患研究,其数学框架也可扩展至抗生素耐药性进化等领域。研究特别强调基因组数据质量对定年分析的关键影响,指出部分GenBank序列存在采集时间标注错误或真实性存疑的问题,建议建立更严格的质控标准。
生物通微信公众号
知名企业招聘