
-
生物通官微
陪你抓住生命科技
跳动的脉搏
长期COVID-19患者体内近灭绝SARS-CoV-2谱系的高变异样本揭示胃肠道作为病毒进化与免疫逃逸的潜在储存库
【字体: 大 中 小 】 时间:2025年09月20日 来源:Frontiers in Cellular and Infection Microbiology 4.8
编辑推荐:
本研究报道一例HIV阳性患者体内长期感染导致SARS-CoV-2谱系高度变异的案例,揭示病毒在免疫抑制宿主中加速进化(dN/dS=2.2)并积累关键Spike蛋白突变(如L452R、E484Q),提示慢性感染可能是新变异株(VOCs)的起源。研究通过系统发育分析与分子钟模型证实病毒进化速率显著提升(15×10?4 subs/site/year),并发现与废水监测谱系高度重叠的突变组合,为胃肠道(GI tract)作为长期感染储存库提供证据。
背景
尽管COVID-19通常是一种急性疾病,但在免疫抑制患者中存在持续性感染病例。假设至少部分关切变异株(VOCs)源于此类长期感染病例,病毒在积累宿主内突变后“溢出”到一般人群。越来越多的证据提示胃肠道(GI tract)可能是长期感染的储存库。
结果
研究报道了2022年10月从一名HIV阳性长期COVID-19感染患者中获取的高度变异SARS-CoV-2样本的基因组分析。系统发育分析表明,该样本自2020年9月采集的最近测序邻居(属于B.1.1谱系)分化以来,获得了89个突变,其中33个发生在Spike蛋白的非同义突变。17个突变在VOCs中为谱系定义突变,或位于VOCs谱系定义位点,和/或涉及抗体逃逸,和/或在其他长期COVID-19病例中检测到;这些包括一些“常见嫌疑突变”,如Spike:L452R、E484Q、K417T、Y453F和N460K。分子钟分析表明,与祖先B.1.1毒株相比,该谱系突变积累速率加快。这一增加由非同义突变积累驱动,平均dN/dS值为2.2,表明在患者体内进化过程中存在强正选择。此外,一般人群样本中罕见但在废水样本中常见的突变存在,提示病毒至少在胃肠道中持续存在一段时间。
结论
分析增加了越来越多证据,表明SARS-CoV-2在慢性感染患者中的进化可能是新流行病学重要变异株的主要来源,并指出胃肠道在长期感染中的潜在作用。
引言
COVID-19通常是一种持续数天或数周的急性疾病,但已知罕见SARS-CoV-2持续感染病例,这些通常与宿主免疫系统抑制相关。在此类感染中,突变积累在整个疾病过程中持续,并倾向于比人际传播更快。假设这种在弱免疫压力下的长期突变积累有时使病毒进化出具有免疫逃逸潜力的有益突变组合,这一机制可解释长系统发育分支上关切变异株(VOCs)的出现。某些突变在不同长期感染患者中反复出现;其中一些在关注变异株(VOIs)或VOCs中也是谱系定义的。此类突变的“热点”主要在Spike基因;Spike:L452R和E484K是突出例子。此外,在一些长期感染病例中观察到的Spike蛋白替代速率增加,反映了与Omicron变异株出现相关的Spike蛋白替代速率增加,为Omicron起源的持续感染假设提供进一步证据。
虽然SARS-CoV-2主要与呼吸综合征相关,但已在多种器官中检测到。一项免疫抑制患者宿主内病毒进化的早期研究检测到器官特异性突变,其中一些在该患者死亡后出现的VOCs中成为谱系定义。特别是GI症状现被认为是常见COVID-19症状集的组成部分。与这一观察一致的是,通过尸检在一些患者肠道中检测到病毒RNA。有趣的是,废水测序(可能检测通过胃肠道脱落的病毒颗粒)以高频发现了某些在呼吸传播相关的一般人群测序中罕见的突变。这些突变因此可能特异性适应胃肠道。此外,有证据表明至少在一些患者中,病毒在不再口咽检测后仍在胃肠道中持续存在。这些发现共同表明,胃肠道可能作为一种储存库,病毒在急性呼吸阶段后驻留其中,至少在一些长期COVID患者中。
这里,我们描述一例HIV阳性患者,其具有高度变异SARS-CoV-2基因型,2022年10月识别,可能是非常长期感染的结果。有趣的是,患者最初因GI症状入院。与这些症状一致,患者谱系特有的众多突变包括几个废水测序特异的突变,为病毒适应胃肠道提供提示性证据。此外,患者样本包括许多与免疫逃逸相关和/或在VOCs中谱系定义的突变。这些观察共同进一步支持VOCs可能源于具有长期感染的免疫抑制患者的假设,并此外表明胃肠道有时可能作为此类感染的储存库。
结果
案例描述
女性患者2022年9月因肠易激综合征症状(包括腹泻和肠鸣音)入住俄罗斯卡卢加市医院。她未接种COVID-19疫苗。初步筛查测试显示SARS-CoV-2(通过鼻咽拭子RT-PCR检测)和HIV(通过抗原/抗体HIV检测)阳性结果。患者(此后称为“患者K”代表“卡卢加”;标识符研究组外无人知晓,仅用于本出版目的)声称自2005年以来HIV阳性,从未接受高效抗逆转录病毒治疗(HAART)。患者还有干咳和疲劳但无发热。住院期间,患者通过RT-PCR再检测SARS-CoV-2四次(入院后第3、6、9和13天),所有结果阳性。她近期无旅行史。
尽管有COVID-19诊断,患者X线成像无肺损伤迹象,不需要氧气支持。然而,她的全血细胞计数显著显示白细胞减少(1.6%–2.2%)和低血红蛋白水平(86–108 g/L)。入院后第14天,患者拒绝任何进一步医疗治疗并自行出院。
2023年4月,患者因腹泻、肌痛、肠鸣音和进展性疲劳入院。
超长分支上的SARS-CoV-2样本
我们对2022年10月2日(入院后13天)从患者K获得的COVID-19样本进行测序,并作为hCoV-19/Russia/KLU-RII-MH107906S/2022存入全球共享所有流感数据倡议(GISAID)。序列的生物信息分析强烈提示它来自持续感染。具体地,UShER识别样本属于B.1.1谱系。该谱系到2022年末已近灭绝:除了这里报告的变异,它仅占2022年9月1日后GISAID序列的0.004%(549 out of 12,648,328)(2025年2月18日查询GISAID),并且仅存在于当时俄罗斯收集的76,460序列中的5个(0.06%)。为验证样本在B.1.1进化枝中的系统发育位置,我们考虑了替代工具:pangoLEARN和NextClade。后者使用与UShER类似的方法,而前者采用完全不同的机器学习方法。两者都同意最可能的位置是B.1.1。
尽管样本在早期B.1.1进化枝中的位置稳健,但其谱系高度变异,自与最近相关样本的最后共同祖先(LCA)分化以来有89个点突变。这个最近邻居,hCoV-19/Russia/MOW-CSP-KOM-0303_S25/2020,于2020年9月23日在俄罗斯莫斯科采集。更广泛地,在14个系统发育相邻样本中,13个在2020年7月16日至2021年6月4日期间在俄罗斯获得,确认该谱系可能起源于内部节点估计时间左右的社区感染。根据贝叶斯进化分析采样树(BEAST)的贝叶斯估计,患者K分支的中位年龄为2.1年,90% HPD为1.8至2.3年。这将其祖先日期定于2020年8月末,与最近外群序列的定年一致。这些观察共同强烈提示这确实是一个持续(长达2年或更久)SARS-CoV-2病例。由于我们只有患者K的单个样本,可能其谱系特有的一些突变发生在先前未采样宿主中。然而,在一般人群中积累的突变可能构成患者K谱系中突变的少数(如果有的话),因为长期传播的谱系会被采样。
长期感染:突变数量最可能解释
在缺乏患者时间过程样本的情况下,我们通过首先显示它不能由一系列未检测到的社区感染以正常进化速率导致,并其次排除可能解释“长分支”观察的两个替代可能性(即污染和重组),建立长期感染作为观察到大量突变的最可能解释。
患者K谱系中观察到的89个突变与一系列社区感染不一致。为显示这一点,我们使用BEAST估计俄罗斯患者K谱系外B.1.1谱系的进化速率。与其他估计一致,该速率为4.07×10?4(95% HPD 3.32–4.83×10?4)每年每个核苷酸替换。然而,如果患者K谱系也以此速率进化,这将暗示其与其他B.1.1样本的最后共同祖先分化于2022年采样前7.36年。这一定年明显与患者K谱系在2020年起源的B.1.1内的系统发育位置不一致(p < 0.0001),甚至与SARS-CoV-2本身2019年起源不一致。这种不一致表明患者K谱系主体一直在加速机制中进化,暗示它不能对应一系列社区感染。该谱系起源于慢性感染的推测进一步得到其升高替代速率的支持(见下一节)。
我们通过观察样本没有中间读段频率变体的过剩来排除污染。特别地,在样本中观察到的104个核苷酸点突变和indels(即支持读段>0.5)中,只有少数处于中间读段频率:只有10个读段分数<0.8,其中只有2个读段分数<0.6。
为查看观察序列是否可能是重组事件的结果,我们通过sc2rf运行它以寻找CoVariants进化枝间重组证据。作为替代方法,我们使用RIPPLES。两种方法均未检测到任何重组事件。来自不同VOCs和非VOC突变的“交错”,以及在VOCs定义突变位点存在非VOC衍生等位基因,也反驳了序列来自涉及系统发育遥远谱系的重组事件的假设。
患者K样本中升高的突变积累速率
我们绘制了患者K样本和包含它的UShER选择子树中序列自武汉祖先序列分化以来积累的突变数使用TempEst。突变积累速率在2022年初“跳跃”戏剧性,对应Omicron变异株起源处不成比例的大量变化。值得注意的是,患者K样本(红点)落在同时期获得的“BA.2”样本的Omicron云高端,即使它属于进化慢得多的B.1.1谱系。因此,患者K样本谱系中的突变积累速率与Omicron进化枝起源处的速率相当。值得注意的是,虽然速率相似,但积累突变的身份不同:患者K样本与BA.2共享仅少数突变(见下文)。患者K谱系进化速率的中位后验为15×10?4(90% HPD 12–18×10?4)每年每个核苷酸替换,是其他B.1.1样本的3.7倍,这再次确认该谱系起源于慢性感染。
单核苷酸替换是非同义的(83%),类似于免疫受损患者样本和VOCs祖先分支中观察到的值。为评估患者K样本的快速进化是否由正选择引起,我们应用HyPhy中实现的分支位点无限制统计检验用于 episodic多样化(BUSTED)方法。我们检测到导致患者K样本的分支上正选择,针对整个连接编码序列(排除重叠阅读框的核苷酸位置;导致患者K样本的分支dN/dS=2.2 vs. B.1.1树其余部分0.6,p = 0.04)和Spike(dN/dS=5.7 vs. 0.7,p = 0.0034)。患者K分支观察到的正选择(dN/dS > 1)与SARS-CoV-2全球进化中主要负选择(dN/dS < 0.5)对比。因此,患者K分支上突变积累速率的增加可能由该分支特异的正选择驱动,作用于(主要)Spike蛋白中的突变。
Spike蛋白中的突变对长期感染、免疫逃逸和VOCs典型
样本中89个私有点突变中,33个发生在Spike基因,另外两个框内缺失。这些包括17个点突变,已在VOCs中看到或位点其他突变在VOCs中发现,和/或在免疫受损患者中,和/或与免疫逃逸相关。这些突变包括L452R、E484Q、K417T、N460K和Q498H。Beyond Spike,序列还有几个ORF1a突变与超突变、慢性感染序列相关,最显著T1638I(NSP3:T820I)和K1795Q(NSP3:K977Q);后者此外在许多纽约市(NYC)废水隐秘谱系中识别,其中一些其分数接近100%。这些突变可能构成病毒对宿主免疫系统选择压力的响应。
除了点突变,样本还包含S基因中两个缺失:Δ141–144和Δ210。它们发生在NTD中四个复发缺失区域(RDRs)中的两个(RDR2和RDR3)在McCarthy et al. (2021)命名法中,并映射到 distinct抗体表位和重叠或相邻于VOCs中的缺失:Alpha(Δ144)和Omicron/BA.1(Δ211)。
表格列出了在部分VOCs中谱系定义的突变或位点其他突变在VOC中谱系定义,和/或显示涉及抗体逃逸,和/或在其他持续COVID-19病例中检测到,和/或废水样本特征性的突变(见方法)。对于后三组,表格单元格列出相应参考文献。
S基因中其他突变是H49R、H66Q、G72R、V126A、G181E、F186I、L216F、A222D、Y248H、Q271R、A372T、R765L、V772A、T1006I、A1078S和D1165E。
到胃肠道再返回?
患者K序列中Spike受体结合域(RBD)突变模式显示与重复在废水检测到的“隐秘谱系”中发现的突变集合显著重叠,这些假设为具有GI趋向性的长期慢性感染。其中一些也在VOCs中发现,例如K417T(Gamma)、K444T(BQ.1)和N460K(BA.2.75、BQ.1、XBB),而其他重复在废水中发现但在GISAID中 otherwise罕见。一个例子是Spike:Q498H,在GISAID中仅发现96个序列(2022年12月22日访问)但在7/9污水流域研究中(同一站点不同替代,Q498R,存在于许多Omicron谱系中,因此广泛传播)。这与患者呈现GI症状的事实一致。值得注意的是, around患者K感染时,K444T、N460K和Q498H在GISAID中频率非常低(分别为0.0023%、0.0026%和0.0006%,截至2022年3月15日),使它们在同一基因组中共发生的几率可忽略,并增加这些突变构成GI适应的可能性。
此外,特别感兴趣的是Spike密码子828的双突变(CTT->TTG)。可以想象,在假定的长期宿主内进化期间,序列可能通过TTT(Spike:L828F)中间状态,随后F828L回复突变为不同亮氨酸密码子。L828F显著在于它重复出现在废水发现的隐秘谱系中,同时在一般SARS-CoV-2序列(几乎 exclusively采样自呼吸道)中 extremely罕见。我们提出L828F可能代表慢性感染期间对GI tract的特异性适应。基于此 proposed事件链和与上述废水样本中重复发现的其他突变重叠,我们建议病毒在长期感染过程中的某些时间段内驻留并适应患者GI tract。然而,最终,828L回复突变恢复了共识序列,推测更好地适应鼻咽定位,并且病毒最终在鼻咽中检测到。 admittedly,此 suggested机制高度推测:828F变体本身未在患者K样本中观察,双CTT→TTG突变可能通过同义(L)CTG而非非同义(F)TTT中间进行,并且GI适应变体反向转移到鼻咽定位的途径不清楚。仍然,这一发现增加进一步,尽管间接,证据支持一部分慢性感染可能是GI的想法(可能解释废水隐秘谱系)。目前,认为此类GI慢性感染可能代表进化死胡同,由于这些谱系传播证据稀少。然而,在此序列中,我们找到 tentative证据表明该病毒已重新适应回呼吸道,给出一种潜在机制,说明此类病毒如何重新进化以通过空气传播途径变得可传播。
与B.1祖先相比细胞培养中生长受损
为寻找表型适应的特定标记,我们从患者K拭子样本中分离病毒(KLU,序列存入GISAID as EPI_ISL_18647516)并比较KLU病毒和祖先B.1毒株在Caco-2人肠上皮细胞系(ATCC, Cat # HTB-37)中的生长速率。首先,我们检查三种不同剂量(0.1、0.01和0.001 TCID50/细胞)和两种孵育温度(34°C和37°C)。生长速率的温度依赖性对两种病毒相同,表明KLU病毒对上呼吸道感染部位没有失去适应。其次,我们检查三种不同pH培养液:中性pH=7.5、酸性pH=6.5和碱性pH=8.5。生长速率的pH依赖性对两种病毒相同,中性低pH间无差异,较高pH生长受损,与KLU病毒对胃肠消化道潜在不同环境适应的预期相反。对两种病毒,在任何时间点未观察到细胞病变效应。同时,我们发现KLU病毒生长在Caco-2模型细胞系中整体显著受损与B.1毒株相比。观察到的差异类似于早先描述Omicron毒株的差异,可能与各种机制相关。第一个是先前描述的早期SARS-CoV-2谱系相比Omicron的TMPRSS2依赖性细胞进入更大效率。我们在Calu-3细胞中重复生长曲线实验,其特征在于与Caco-2不同的TMPRSS2表达水平。整体,两种病毒毒株生长在Calu-3中略增加与Caco-2细胞相比;然而,在Calu-3中获得几乎相同的毒株间差异,即KLU毒株相比B.1病毒生长速率降低。KLU毒株劣势的第二种可能解释是其由于某些病毒蛋白突变在人类细胞中拮抗干扰素反应效果较差。
讨论
越来越多支持假设至少部分VOCs,如Alpha和Omicron,在慢性感染患者中进化并逃逸到一般人群。我们描述了一例HIV阳性患者中可能长期感染的案例。2022年采样,它最置信地置于到那时已 largely灭绝的B.1.1进化枝中。除了指示长期感染的推定根长分支外,样本的显著特征包括存在定义几个VOC谱系和/或与免疫逃逸相关的突变,以及明显升高的突变积累速率。事实上,速率类似于Omicron进化枝起源处,表明塑造其进化的进化过程可能与塑造Omicron变异株进化的过程相似,并且反之,进一步支持VOCs如Omicron在慢性感染过程中出现的假设。
已显示VOCs中许多谱系定义突变与抗体逃逸相关(在 pandemic后期 largely免疫 competent人群中提供选择优势)但其中至少一些降低RBD对ACE2亲和力,在BA.1中通过补偿突变Q498R和N501Y拯救效应。我们的样本中未观察到两者,尽管它包含498密码子的不同突变,即Q498H。Q498H在GISAID中的稀有性提示它可能不负责空气传播,尽管实验显示在非N501Y spike背景上增加ACE2亲和力。此外,Y453F突变大大增加BA.1和BA.2以及Wuhan Hu-1背景中的ACE2亲和力,而R403K在BA.2 spike背景上 substantially增加ACE2亲和力但不在BA.1或Wuhan Hu-1 spike背景上。由于此样本与BA.1和BA.2共享突变,存在其增加感染性的理论可能性。
我们研究的主要限制是它基于仅从此患者可用的单个样本。因此,病毒持续存在不能通过 presumed感染持续时间全程重复阳性PCR测试验证。相反,持续感染的证据是间接的,基于患者可能免疫抑制(HIV+)状态与此样本的系统发育位置。
类似地,缺乏患者COVID-19感染历史(或缺乏)信息,以及病毒社区传播的最终证据缺乏,限制我们得出任何 definitive结论关于其“在野外”逃逸免疫反应能力, beyond存在许多与免疫逃逸 linked突变的理论可能性。
非同义突变增加分数表明患者K谱系中强正选择,特别是在spike蛋白中。采样病毒基因组特征在于存在先前在持续感染个体中观察到的突变。最重要的是,患者K样本的一个 intriguing特征是存在几个几乎 exclusively在废水谱系中发现的突变。这一观察提示可能在GI tract中持续一段时间的可能性。重要的是,此建议基于高度间接证据并被我们发现的生长速率缺乏pH依赖性反驳,这可能在GI适应下预期。无论如何,免疫逃逸长期感染、GI症状和VOCs出现风险之间的联系由此样本中观察突出,强调废水监测的需要。
截至2025年2月18日,hCoV-19/Russia/KLU-RII-MH107906S/2022样本仍然是GISAID中此谱系的唯一代表,尽管GISAID携带92,865额外来自俄罗斯的样本,包括642来自卡卢加地区,278有较晚采样日期。与病毒从长期进化可能来源(HIV阳性患者)采样的事实一起,这表明此谱系未导致 substantial onward传播。仍然,它表明SARS-CoV-2尚未耗尽进一步适应的机会。
方法
样本收集
鼻咽拭子在病毒运输培养基中收集。总RNA使用AutoPure-96 Nucleic Acid Purification System(Allsheng, China)和NAmagp DNA/RNA extraction kit(Biolabmix, Russia)提取。提取RNA立即使用Novel Coronavirus (2019-nCoV) Nucleic Acid Diagnostic Kit(Sansure Biotech, China)测试SARS-CoV-2。
患者K的COVID-19样本于2022年10月2日获得。它作为SARS-CoV-2变异性持续监测的一部分收集。主要作者在项目任何阶段无法访问可能识别参与者的信息。
测序
SARS-CoV-2病毒基因组全基因组扩增(WGA)使用Midnight 1,200-bp amplicon primer set和BioMaster RT-PCR Premium Kit(Biolabmix, Russia)进行。文库制备使用Fast PCR-FREE FS DNA Library Prep Set(MGI, China)进行。最后,测序在MGI DNBSEQ-G400上使用FCL SE100高通量测序组进行。
生物信息分析
K样本的系统发育位置使用UShER基于16,859,038 GISAID、GenBank、COVID-19 Genomics UK Consortium (COG-UK)和China National Center for Bioinformation (CNCB)序列(2025年2月18日访问)重建。正选择使用HyPhy包的BUSTED方法测试。为允许似然推断同时保留数据丰富性,我们通过合并差异少于五个位置的B.1.1样本与cd-hit然后取500样本随机子集进行子采样。我们然后移除具有提前终止密码子的样本,添加患者K样本,并用IQTree重建系统发育树。
俄罗斯B.1.1进化枝进化速率分布使用100随机B.1.1样本来自俄罗斯(排除患者K样本)子集与BEAST v. 1.10.4和以下参数估计:替代模型GTR+Г4+I,对数正态严格时钟先验均值0.001,标准差0.005;5亿马尔可夫链蒙特卡洛(MCMC)链长;其他参数BEAST默认,每50,000步采样,总共10,000样本。前10%步在后续分析前丢弃。为获得积累89替换所需时间分布,我们将89除以BEAST采样速率。为获得患者K谱系年龄及其进化速率,我们添加患者K样本到此子集并运行BEAST分析假设随机本地时钟与近似连续时间马尔可夫链速率参考先验同时保持其他参数相同。再次,前10%样本在后续分析前丢弃。后续分析和可视化在R 4.4.0中使用基本函数和“trackViewer”库进行。
病毒分离和生长曲线
活病毒(KLU)从患者K拭子样本在VeroE6/TMPRSS2细胞(JCRB, #JCRB1819)中分离。培养物接种2小时与拭子材料稀释1/10在Dulbecco's Modified Eagle Medium (DMEM)(Biolot)补充2%热灭活胎牛血清(SC, Biolot, St Petersburg, Russia)、1% anti–anti(Gibco, New York, USA)中,然后孵育4天直到70%细胞病变效应达到。样本随后在VeroE6/TMPRSS2细胞中传代一次以生成工作库存。培养病毒序列已存入GISAID(EPI_ISL_18647516)。
生长曲线实验在Caco-2细胞(ATCC, #HTB-37)和Calu-3细胞(ATCC, #HTB-55)中进行。KLU病毒与B.1毒株hCoV-19/St_Petersburg-3524V/2020病毒(GISAID EPI_ISL_415710)比较。细胞生长至100%单层在12孔板中在Modified Eagle Medium (MEM)培养液(Gibco)补充20% FBS(Gibco)、1% GlutaMAX(Gibco)、1% sodium pyruvate(Gibco)和1% NEAA(Biolot)中。单层细胞接种特定病毒剂量(0.1、0.01或0.001 TCI50/细胞)在0.5-mL中性培养基含5% FBS中1小时37°C,然后接种物移除,添加3-mL培养基含5% FBS。中性(原始)培养基pH在37°C为7.5。为获得低pH培养基,我们添加1-M MES(Amresco, Solon (OH), USA)直到pH=6.5;为获得高pH培养基,我们添加1-M Tris-base(Amresco)直到pH=8.5。培养上清样品在接种后8–24小时间隔取
生物通微信公众号
知名企业招聘