新冠病毒传播精细模式:基于相同病原体序列的深度解析

【字体: 时间:2025年03月06日 来源:Nature 50

编辑推荐:

  为探究传染病传播模式,研究人员分析 114,298 个 SARS-CoV-2 基因组,揭示传播规律,助力疫情防控。

  新冠疫情给全球带来了巨大冲击,了解新冠病毒(SARS-CoV-2)的传播模式对于防控疫情至关重要。然而,传统的研究方法在应对大规模病原体基因组数据时存在诸多困难。一方面,现有的系统发育地理方法在处理几百或几千个以上的序列时,因系统发育树推断的困难而难以扩展;另一方面,测序的不均衡会导致结论出现偏差。因此,迫切需要新的方法来深入剖析病毒的传播规律,以便更有效地制定防控策略。
来自美国多个研究机构(如 Fred Hutchinson Cancer Center、University of Washington、Washington State Department of Health 等)的研究人员开展了相关研究,该研究成果发表在《Nature》上。研究人员通过分析 114,298 个 SARS-CoV-2 基因组,这些基因组是通过华盛顿州基因组哨兵监测系统收集的,并且包含了相关的年龄和居住位置信息。研究发现,相同序列的地理位置与流动性和社会接触数据的预期高度一致,还发现了年龄组之间的传播模式在不同空间尺度上存在差异,以及不同年龄组在疫情传播过程中的作用。这些发现对于理解传染病的传播机制具有重要意义,为疫情防控提供了关键的科学依据。

研究人员采用了多种关键技术方法。首先,对收集的 SARS-CoV-2 基因组序列进行预处理,从 GISAID EpiCoV 数据库提取共识序列,并利用 Nextstrain nCoV ingest pipeline 进行整理,同时对序列的元数据进行了细致的整理和筛选。其次,通过计算成对遗传距离来确定相同序列的聚类情况,使用 Hamming 距离在属于同一 Nextstrain 进化枝的序列间进行比较。最后,引入相对风险(RR)框架来量化不同群体间的关联,该框架能够校正测序偏差,从而更准确地研究病毒传播的相关因素。

研究结果主要体现在以下几个方面:

  1. 相同序列的时空信号:随着时间推移,病原体序列会积累突变,传播链中相近的个体感染的病毒在基因上也更为接近。研究人员在华盛顿州识别出 17,231 个相同序列的聚类(不包括单例),对应 59,660 个序列。在一些大的聚类中,观察到病毒先在局部传播,然后才在更广泛的地理区域扩散。并且,聚类的空间扩展随时间增加,但显著低于随机预期;聚类在首次发现的县和邮政编码内的留存概率随时间降低,但又显著高于随机预期,这表明相同序列的聚类包含很强的时空传播特征。
  2. RR 框架分析:研究人员引入 RR 框架来量化群体亚组之间的关联。通过分析发现,在同一县内观察到相同序列的 RR 中位数为 4.7,这表明基因相近序列(尤其是相同序列)的位置对于了解当地传播模式具有重要意义,即感染个体更常在其所在县内传播病毒。此外,RR 框架不受测序努力程度的影响,能够有效校正区域间测序不均的问题,相比传统的离散性状分析(DTA),在研究 SARS-CoV-2 传播的决定因素方面更具优势。
  3. 华盛顿州县之间的传播模式:通过分析相同序列在华盛顿州县之间的出现模式,发现相同序列在地理上相邻的县内出现的风险更高。MDS 算法分析显示,华盛顿州东西部地区(EWA 和 WWA)之间的病毒传播存在差异,且传播一般从 WWA 流向 EWA。这一结果与之前对华盛顿州第一波新冠疫情的系统发育地理分析结论相符,说明该研究在病毒传播方向的研究上具有一致性和可靠性。
  4. 与人类流动性的关系:研究人员利用手机移动数据和通勤数据来研究人类流动性与病毒传播的关系。结果发现,人类流动性数据能够解释 60% 的相同序列数据方差,在区域层面进行分析时,这一比例可提高到 81%。这表明人类流动性对病毒传播的空间模式具有高度预测性,能够解释部分病毒传播的空间格局。
  5. 异常值与男性监狱的关联:研究人员发现了一些不符合流动性和遗传数据关系的异常传播模式,这些异常模式与男性监狱所在的县有关。例如,在 Franklin - Mason 和 Walla Walla - Mason 等非相邻县之间,观察到比预期更多的相同序列对。进一步研究发现,这些县是男性州立惩教中心的所在地,监狱网络的结构对 SARS-CoV-2 的传播模式有显著影响,这揭示了与普通社区不同的病毒传播网络。
  6. 年龄传播模式的空间差异:研究人员通过分析相同序列在不同年龄组之间的分布情况,发现空间尺度会调节年龄组之间的疾病传播模式。来自同一县和邮政编码的相同序列对在同一年龄组中更为富集,尤其是在老年群体中。这表明老年人的病毒传播往往发生在家庭附近,其活动范围相对较小。同时,研究还发现不同年龄组在疫情传播过程中的作用随时间变化,在不同的疫情波次中,不同年龄组作为感染源的情况有所不同。
  7. 相同序列收集时间的分析:研究人员通过分析相同序列的收集时间,发现不同年龄组在疫情传播过程中的作用存在差异。在第四和第五波疫情中,年轻年龄组可能是老年人感染的来源;在第六波疫情中,10 - 19 岁的个体可能是其他年龄组感染的来源。总体而言,研究结果表明 SARS-CoV-2 在不同年龄组之间的传播具有一定的渗透性,低风险群体在向高风险群体传播感染方面发挥了一定作用。

研究结论和讨论部分强调了该研究的重要意义。通过对 SARS-CoV-2 传播模式的精细分析,研究人员利用大规模病原体基因组测序数据,结合详细的元数据,为理解传染病传播提供了新的视角。这种基于相同病原体序列的研究方法具有广泛的适用性,可用于研究其他快速进化的病原体在不同群体间的传播。然而,该研究也存在一定的局限性,如 RR 指标无法描述未采样地点的传播模式,且 RR 值会受到传播强度的影响等。尽管如此,该研究仍然为未来的疫情防控和传染病研究提供了重要的参考,有助于制定更精准有效的防控策略。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号