SARS-CoV-2突变谱复杂性:一种流行病学可进化特征及其对病毒适应性潜能的启示

【字体: 时间:2025年09月25日 来源:Proceedings of the National Academy of Sciences 9.4

编辑推荐:

  本研究发现随着COVID-19大流行进展,SARS-CoV-2的突变谱复杂性(病毒基因组异质性)显著降低,而共识序列仍持续分化。通过对比马德里地区6个疫情波次的病毒分离株,证实突变谱收缩与病毒复制保真度无关,而是流行病学与病原性因素驱动的适应性进化表现。该研究揭示了病毒群体遗传动力学(quasispecies dynamics)对疫情演化的关键影响,为分子流行病学研究提供了新视角。

  

Significance

SARS-CoV-2突变谱复杂性在COVID-19大流行进程中呈现系统性收缩现象。这一发现表明,后期疫情波次的病毒可用的适应性突变路径减少,但共识序列的进化速率仍保持稳定。研究强调了通过标准共识序列分析与突变谱分析所能获取的病毒分子流行病学和适应性潜能信息存在显著差异,为理解病毒进化机制提供了新的维度。

Abstract

RNA病毒种群由复杂且动态的突变谱构成,其中大多数个体基因组在同一种群内存在一位或多位点差异。这种称为准种动态(quasispecies dynamics)的行为同样适用于SARS-CoV-2,其在人群中高速进化的同时表现出宿主内遗传和功能异质性。本研究通过分析2020年至2022年间马德里地区收集的早期与后期COVID-19疫情波次分离株,发现后期分离株的突变谱复杂性(宿主内病毒基因组异质性)显著降低。值得注意的是,相应分离株的共识(平均)序列随着大流行进展持续偏离初始Wuhan-Hu-1病毒。通过Vero E6细胞复制实验发现,从第一和第六波疫情分离株及其生物学克隆株产生的突变谱复杂性相似,表明体内观察到的突变谱复杂性降低并非由于病毒复制机制精确度提高,而是与病毒流行病学或致病性相关的其他因素所致。研究结果确立了遗传可变病毒的突变谱复杂性可作为流行病学可进化特征的重要结论。

病毒进化背景与突变谱意义

RNA病毒在人群中的进化速率比其分化宿主有机体快近百万倍,这是RNA遗传元件的一个关键特征,对病毒致病机制、持久性建立、长期存活及疾病防控策略具有深远影响。病毒进化速率通常通过比较不同时间间隔分离株的共识基因组序列来测量。由于RNA病毒常达到的有效种群规模,共识基因组序列是多序列的加权平均值,不一定与样本中最频繁序列一致。感染个体内的序列集合称为突变谱、分布、云或群,其复杂性和持续组成变化符合准种理论概念。突变谱复杂性由RNA病毒的高突变率驱动,实际突变组成受负向和正向选择(根据不同环境影响不同变异基因组)以及不同强度的随机瓶颈事件(创始基因组数量)共同塑造。

尽管SARS-CoV-2是编码ExoN校对修复活性的冠状病毒,但其在人群中的进化速率仍达到每核苷酸每年10?3至10?4突变,与其他RNA病毒相当。自2020年以来,世界卫生组织已识别多个关注变异株,具有特征基因组特征的连续病毒进化枝形成了七个COVID-19疫情波次。在进化过程中,病毒的传播性、宿主部位复制偏好、神经嗜性和抗原特征等性状发生改变。COVID-19患者病毒nsp12少数单倍型中氨基酸替代对RNA合成的修饰功能此前已有表征,其在短时间内多个感染个体突变谱中的识别表明功能相关变化在感染个体内以高频率出现。

研究方法与样本特征

研究对马德里地区2020年4月至2022年12月期间六个COVID-19疫情波次(称为1、2、3+4、5、6和7波)的鼻咽分离株进行了共识基因组序列测定,每个波次10个分离株,共60个分离株。由于第三和第四波在时间上大部分重叠,将其合并为一组。所有患者样本在进入本研究前均经过匿名化处理,患者的感染严重程度、临床特征和合并症数据均经过标准化采集,未发现明显偏倚。每个分离株的共识序列均独一无二,通过Nextclade系统进行的进化枝分配与全球同期观察到的SARS-CoV-2进化枝分布一致。

相对于参考分离株Wuhan-Hu-1的平均突变数从第一波的7.5个增加到第七波的78.5个,同时识别出17个不同缺失。比较60个共识序列发现,1.6%的基因组位置存在变异(突变或缺失)。不同疫情波次突变数增加情况因基因组区域而异,特别是S基因的突变数在第六和第七波显著高于前几波。所有疫情波次的点突变类型偏好排序相似,C→U转换是最频繁类型。在患者队列样本中,82%的突变是偶尔性的(仅在一个疫情波次检测到),17%是波动性的(在至少两个波次检测到),0.8%是普遍存在的(在所有波次检测到)。

突变谱复杂性分析

通过超深度测序分析对nsp12(聚合酶)编码区(核苷酸14,534至16,054)的四个扩增子(A1至A4)和S编码区(核苷酸22,872至23,645)的两个扩增子(A5和A6)进行了突变谱复杂性评估,这些区域覆盖SARS-CoV-2基因组的7.7%。通过平均不同突变数和多个多样性指数对每个疫情波次的四个分离株的突变谱复杂性进行了评估。

出乎意料的是,比较24个突变谱发现,第五、第六和第七波分离株的复杂性显著低于前几波分离株。复杂性降低在nsp12和S基因组区域几乎完全相同,主要是由于0.10%至0.49%频率范围内的所有类型点突变数量减少所致。这表明SARS-CoV-2的突变谱复杂性在COVID-19大流行过程中易受调节,并在后期疫情波次分离株中呈现显著降低。

细胞培养验证实验

为验证后期疫情波次病毒突变谱复杂性降低是否由于病毒复制错误率降低,研究比较了第一波(显示最大突变谱复杂性)和第六波(显示最低复杂性)病毒在细胞培养环境中的表现。病毒种群及其生物学克隆(噬斑分离株)在Vero E6细胞中进行最小化培养后测定其复杂性。所有种群的病毒RNA进入扩增的量以及用于测序的DNA量均进行匹配,以避免初始RNA模板分子数差异导致的多样性指数偏差;基因组变异相对于相应种群或克隆的共识序列进行计数。

结果显示,在Vero E6细胞制备的种群和克隆中,第六波与第一波病毒之间的复杂性没有降低,与鼻咽分离株病毒的差异形成鲜明对比。13个多样性指数也得出了相同结论:第一波和第六波病毒在细胞培养制备中具有相似复杂性。这一结果排除了后期COVID-19波次分离株突变谱减少是由于相应RNA依赖性RNA聚合酶复合物模板复制保真度提高的可能性。在COVID-19大流行期间观察到的突变谱收缩现象,在相同病毒置于细胞培养环境时未出现多样性改变,确立了SARS-CoV-2突变谱复杂性作为流行病学可进化特征的地位。

讨论与机制阐释

SARS-CoV-2表现出宿主内遗传和表型异质性,尽管其编码ExoN校对修复活性。突变谱的幅度(每单位种群大小的基因组变异位置数)决定了自然选择作用的基因组库容量,也决定了瓶颈启动替代多样化途径的能力。

突变谱复杂性降低可能源于病毒进化过程中复制期间突变产生减少, due to聚合酶复制复合物保真度提高。 Alternatively,突变谱收缩可能反映病毒对人类群体的适应,或在某些宿主位点更特化的复制。对环境的适应和对某些宿主位点的特化复制(我们称为致病-流行病学因素)都会通过负选择有利于新出现变异的消除。

支持致病-流行病学因素参与突变谱收缩的证据在于:第一波和第六波COVID-19的鼻咽分离株(及其生物学克隆)在Vero E6细胞中显示出相似的突变谱复杂性。nsp7、nsp8、nsp12和nsp14(已知参与病毒RNA合成的蛋白质)的共识序列中氨基酸替代的缺失也支持这一结论,这些替代可能解释聚合酶保真度的变化。

从现有证据来看,致病-流行病学条件而非分子指令导致的较低错误率,似乎是COVID-19大流行进程中突变谱收缩的基础。病毒可以通过多种途径从鼻咽区域转运进出。后期COVID-19波次鼻咽分离株中聚集的病毒可能比早期波次病毒在更少的宿主位点复制。事实上,2021年末出现的Omicron BA.1.1与先前变体相比,显示出宿主内组织分布的显著减少。突变谱复杂性降低与病毒引起的较高COVID-19严重程度相关的可能性也很小,原因有二:i)注意不偏向选择早期波次较低疾病严重程度的鼻咽分离株;ii)第一波COVID-19轻症和重症(死亡)患者分离株的突变谱复杂性差异远小于本文分析的波次1、2与波次6、7分离株之间的差异。

共识序列与突变谱的进化分歧

共识序列和突变谱复杂性呈现不同趋势。在共识序列中,相对于武汉病毒祖先的突变数量增加,进化速率在大流行期间保持稳定,而突变谱显示较低复杂性。然而,与我们的结论一致的是,对共识基因组序列随机分层数据集的序列组成复杂性计算显示向下进化趋势,表明基因组结构对人类宿主的适应。我们对共识序列和突变谱的比较表明,个体宿主内种群的基础多样性(选择和随机漂变作用其上)并不是整体持续进化速率的限制因素。

刺突(S)基因组区域是大流行进程中积累突变数量最多的区域,非同义与同义替换比为8.2(范围3.0至15.3,后期波次病毒中比例呈增加趋势)。在60个共识序列中波动或普遍存在的27个不同氨基酸替代中,19个影响暴露残基,7个位于与ACE2相互作用的域中。在S和N蛋白的六个位置中,在七个波次中最多三个氨基酸发生交替。这种交替此前在六十年全球进化的小核糖核酸病毒口蹄疫病毒抗原位点中已有报道。这再次表明即使对于相对灵活的S和N蛋白,序列空间占居也存在限制。

研究意义与展望

结果表明突变谱复杂性在病毒大流行过程中可能是一个可变性状。鉴于可能影响SARS-CoV-2感染症状和进展的多个人类基因组决定因素,将病毒分离限制在特定地理区域进行比较非常重要。将类似研究扩展到其他患者队列将加强这一概念:突变谱作为表型库的作用可能不需要持续的多样性来促进病毒适应性和快速进化。从一般进化角度来看,显著的突变谱减少并未阻碍种群水平的持续流行病学适应性,这一发现具有重要意义。

材料与方法

SARS-CoV-2患者样本

60个SARS-CoV-2鼻咽分离株分为六组:波次1、2、3和4(合并)、5、6和7,用于测定共识基因组序列。第三和第四波分离株合并是因为这两个波次在马德里地区时间上重叠,病毒归属不明显。每组选择四个分离株用于nsp12(聚合酶)和S编码区的超深度测序。患者样本在进入本研究前均经过匿名化处理,所有程序经医院伦理委员会批准。

Vero E6细胞感染

Vero E6细胞按先前描述培养和维护。鼻咽样本部分用于以0.0001至0.015 PFU/细胞的感染复数感染Vero E6细胞,72小时后收集子代病毒。每个子代病毒部分用0.01%脱氧胆酸盐处理10分钟,稀释后铺于Vero E6细胞单层上,覆盖半固体培养基。分离良好噬斑,重悬后用于感染Vero E6细胞,感染允许进行72至144小时。然后使用QIAamp Viral RNA Mini Kit 250提取细胞培养上清液RNA,通过RT-qPCR定量。

病毒RNA的RT-qPCR定量

使用Light Cycler RNA Master SYBR green I试剂盒,扩增nsp12编码区残基14,890至15,320的RNA。定量标准是使用包含病毒基因组残基14,511至15,717的质粒体外转录的RNA。

使用COVIDSeq平台的共识测序

DNA文库根据COVIDSeq协议(Illumina)制备。SARS-CoV-2基因组RNA使用COVIDSeq Primer Pool-1 & 2(Illumina)扩增,该引物池设计用于扩增整个病毒基因组。所得扩增子经过片段化和标签化,使用IDT for Illumina PCR Indexes Set 1进行扩增。单个文库定量后等摩尔浓度混合,使用Illumina MiSeq平台与MiSeq v2 Reagent Kit 300 cycles PE进行测序。

共识基因组序列的系统发育分析和进化枝分配

使用MAFFT v7.453软件比对基因组序列,然后使用IQ-Tree v2.0.5推断最大似然系统发育树,使用其Model Finder功能,通过贝叶斯信息准则估计最适合每个数据集的核苷酸替代模型。通过Shimodaira-Hasegawa近似似然比检验和超快自举近似各1,000次重复评估每个系统发育的树拓扑结构。

超深度测序

用于从患者鼻咽样本或Vero E6细胞中生长的生物学克隆扩增病毒RNA的寡核苷酸引物基于NCBI SARS-CoV-2数据库的663个序列设计,与Wuhan-Hu-1 NC_045512.2序列比对。每个扩增使用5μL RNA制备物(提供可比量的病毒RNA),使用Transcriptor One Step RT-PCR Kit进行。扩增产物在2%琼脂糖凝胶上电泳,使用QIAquick Gel Extraction Kit纯化,使用Qubit dsDNA Assay Kit定量,在进入核苷酸测序前测试质量。

深度测序可靠性和交叉污染控制

通过多个实验控制和生物信息学评估来评估超深度测序分析中识别的突变和单倍型的可靠性。主要事实包括:i) 每个扩增子的平均清洁读长覆盖率约为100,000;ii) 使用0.5%和0.1%频率 cutoff时,nsp12和S编码区突变在三密码子位置的分布相同;iii) 相同样本重复序列中的突变和单倍型库及频率高度一致;iv) 使用0.1%和0.5%突变频率 cutoff时,97.5%记录的氨基酸替代在outbreak.info数据库中均有表征;v) 从超深度测序数据推导的氨基酸替代的平均可接受性(根据PAM 250替代矩阵)和预测功能效应(使用SNAP2预测器)相似;vi) 点突变频率 cutoff从0.5%降至0.1%时,nsp12和S编码区发现的不同突变总数分别增加55倍和97倍。

为避免病毒、RNA或DNA样本间的交叉污染,实施了以下预防措施:i) 样本收集和运输过程中防止容器间接触;ii) 在BSL-3设施中,每个样本单独在高级别 containment Class II, type A生物安全柜中操作;iii) 进行开放性试管实验验证;iv) 使用不可回收材料,工作后使用VIRKON消毒;v) RT-PCR扩增试剂在标准生化实验室的隔离柜中制备;vi) 常规进行阴性RT-PCR扩增对照。

统计学分析

疫情波次间和基因组区域间突变数差异、偶尔性、波动性和普遍存在突变间差异以及突变类型差异通过RStudio 4.0.2中的比例检验评估。数据正态性通过Shapiro-Wilk检验确定。不同疫情波次进化速率差异通过Kruskal-Wallis检验,然后Dunn多重比较检验比较。鼻咽分离株突变谱突变数差异通过单因素ANOVA,然后Tukey多重比较检验评估。Vero E6细胞中生长的种群和第一波和第六波生物学克隆间突变数差异通过t检验评估。多样性指数间差异通过Kruskal-Wallis检验,然后Dunn多重比较确定。生物学克隆核苷酸序列重复间的相关性通过Pearson相关检验评估。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号