
-
生物通官微
陪你抓住生命科技
跳动的脉搏
中国山东地区SARS-CoV-2奥密克戎变异株的宿主内变异与传播动态研究
【字体: 大 中 小 】 时间:2025年09月25日 来源:mSphere 3.1
编辑推荐:
本研究深入解析了SARS-CoV-2奥密克戎变异株在宿主内的遗传多样性(iSNV)特征及其传播机制,揭示了高密度基因组区域中共享iSNV形成的共突变模式,指出其在缺乏流行病学关联样本间的独立出现现象,并证实iSNV可作为单核苷酸多态性(SNP)的突变库,为病毒进化与传播链推断提供了关键分子依据。
研究团队对2022年3月山东奥密克戎疫情中4个传播集群(SD-1至SD-4)的803份样本进行深度测序分析,这些样本分属BA.1.1、BA.2和BA.2.3三个遗传亚系。采用严格生物信息学流程进行iSNV检测:测序读数通过BWA-MEM比对至参考基因组(Wuhan-Hu-1),使用Picard去除PCR重复序列,并设定多重过滤标准(Phred碱基质量≥20、测序深度≥100×、支持读数≥10、链偏倚<10倍、等位基因频率介于3%-70%)。为排除交叉污染,特别验证了iSNV与SNP位点的重叠率仅为8.37%,显著低于既往报道。
共鉴定出1,470个iSNV位于1,133个基因组位点,中位数为每样本1个iSNV。54.05%的样本(434/803)携带至少一个iSNV。随时间推移,iSNV密度从0.03升至0.23个/千碱基,显示流行病进程中变异积累加剧。全基因组iSNV密度为0.06个/千碱基,其中编码区占97.69%(1,436个),非编码区密度较低(5′ UTR:0.08, 3′ UTR:0.07)。ORF1ab承载最多iSNV(73.96%),S基因和N基因分别占11.49%和4.60%;经长度标准化后,ORF7a密度最高(0.09个/千碱基)。
基因组距离分析显示iSNV分布非随机(Kolmogorov-Smirnov检验, P<0.001)。密码子位置分析揭示ORF1ab中第三密码子变异最多,第二密码子最少(Fisher精确检验, P<0.05)。N基因呈现第三密码子偏好性及较低非同义/同义突变比(1.13 vs 1.91, P=0.03),提示其受负向选择压力较强。
研究特别识别出两个高频变异区:位于nsp3的5,700-5,800区域(密度1.12个/千碱基,全基因组19倍)和nsp13的16,700-16,800区域(密度0.42个/千碱基,全基因组7倍)。这些区域呈现第一密码子变异优势及极高非同义/同义突变比(23.8 vs 1.7, P<0.001),等位基因频率分析显示非同义突变中位AF(0.10)高于同义突变(0.06),暗示强正选择作用。
高频变异区共享iSNV比例高达96.8%(其他区域仅22.9%),其中非同义突变G5743C、T5744C、G5765A、G5766C和C16708G形成显著共现簇。网络分析(Cytoscape构建)显示这些变异通过样本连接形成紧密集群。单倍型分析揭示CCAC模式(对应四联突变)在752个高深度样本中占主导,且该模式样本均携带C16708G。线性回归证实五处变异强相关(Pearson相关系数>0.7, P<2.5×10?87),表明其构成协同进化单元。功能注释指出前四突变位于nsp3编码的木瓜样蛋白酶(PLpro),参与病毒蛋白切割与宿主免疫逃逸;C16708G位于nsp13(解旋酶),干扰干扰素产生,提示这些变异可能增强病毒适应性。
70.82%的iSNV为样本独有,29.18%存在于≥2个样本。197个高频共享iSNV(>5样本)未位于测序错误或同质位点。七处高频共享位点中,仅G13109A为非同义突变(ORF1ab-D4282N),且C7303T跨传播集群出现,表明独立起源。样本对分析显示仅1.06%(994/93,961对)共享≥1个iSNV,其中24.4%(243对)无流行病学关联。15对样本虽SNP差异仅2-3个且采集时间相近(≤2天),但74%在不同测序批次处理,排除了交叉污染可能。共感染分析确认所有样本均为单一亚系感染,避免了混合毒株对结论的干扰。
排除奥密克戎特征突变位点后,鉴定出37个“潜在固定位点”(iSNV在一样本中与另一样本同位置SNP对应)。固定位点AF显著高于非固定位点,且同义突变比例更高,非同义突变仅分布于ORF1ab、S和ORF3a基因。系统发育分析显示,20个编码区固定位点中,含iSNV样本与同SNP分支的patristic距离显著更近(P<0.001),11个位点经多重校正后仍显著(如位点13,051:C→T突变在系统树中与iSNV聚集于祖先节点)。动态监测揭示C23978T和C20404T在单一传播集群内AF随时间逐渐升高并固定。尤为重要的是,BA.1.1样本中检测到BA.2和BA.2.3特征突变(C21618T和C26060T)的iSNV形式,证实iSNV作为新亚系突变的储备库。
本研究系统刻画了奥密克戎变异株的宿主内多样性图景,揭示高频变异区在驱动共突变模式中的核心作用。尽管共享iSNV具有进化意义,但其在无关联样本中的趋同发生限制了传播链推断的可靠性,提示需结合多证据链进行精准溯源。iSNV向SNP的转化机制为理解病毒适应性进化提供窗口,尤其早期亚系中潜伏的变异可能成为后续优势毒株的奠基突变。研究局限包括未直接观测iSNV固定全过程及共突变功能的实验验证,未来需扩大样本与时间尺度解析关键突变的全进化轨迹。
生物通微信公众号
知名企业招聘