多国及跨部门评估食源性病原体基因组监测流程的聚类一致性:推动公共卫生监测新进展

【字体: 时间:2025年04月29日 来源:Nature Communications 14.7

编辑推荐:

  食源性病原体(FWD)严重威胁人类和动物健康,不同实验室用于 FWD 监测的全基因组测序(WGS)流程不同,影响结果可比性。研究人员评估了四种重要食源性病原体的 WGS 流程聚类一致性,发现总体有一致性但存在差异,为监测提供重要信息,推动国际和跨部门合作。

  在全球范围内,食源性病原体(Food and Waterborne Pathogen)引发的疾病每年都影响着数以亿计的人口,给人类和动物的健康带来沉重负担。为了有效预防和控制这些疾病,建立高效的监测系统至关重要。全基因组测序(Whole-Genome Sequencing,WGS)技术的出现,为食源性病原体监测带来了新的机遇,它能够提供高分辨率的病原体信息,帮助快速检测和调查潜在的疫情爆发。
然而,目前不同实验室在进行食源性病原体的 WGS 监测时,采用的生物信息学流程(pipeline)各不相同。这些流程在数据处理和分析上的差异,使得监测结果的可比性受到质疑,进而阻碍了跨部门和国际层面的有效沟通与合作。想象一下,不同实验室就像一个个独立的 “信息孤岛”,各自使用不同的 “语言”(流程)来解读病原体的信息,这无疑给全球范围内的食源性病原体监测工作带来了巨大挑战。

在这样的背景下,来自欧洲多个国家的 11 个研究机构,包括食品、动物和人类健康领域的专业人员,共同开展了一项大规模研究。他们旨在评估不同 WGS 流程在所有分辨率水平上的聚类一致性,并对四种重要的食源性病原体 —— 单核细胞增生李斯特菌(Listeria monocytogenes)、肠炎沙门氏菌(Salmonella enterica)、大肠杆菌(Escherichia coli)和空肠弯曲菌(Campylobacter jejuni)在爆发水平上的聚类组成进行深入比较分析。

研究人员通过一系列复杂而严谨的实验和分析,得出了许多重要结论。首先,对于大多数物种,基于等位基因的流程之间总体上具有一致性,但空肠弯曲菌是个例外,不同的等位基因分型方案导致了明显的差异。这表明在空肠弯曲菌的监测中,需要更加谨慎地选择和评估监测流程。其次,研究发现不同流程在爆发检测方面存在不可忽视的差异,而灵活调整阈值有助于不同实验室检测到相似的爆发信号。这一发现为优化爆发检测策略提供了重要依据。此外,研究还表明不同的传统分型组(如血清型)具有显著不同的遗传多样性,这对于未来制定爆发病例定义和基于 WGS 的命名设计具有重要价值 。

这项研究成果发表在《Nature Communications》上,具有多方面的重要意义。它为全球食源性病原体监测提供了宝贵的信息,有助于不同实验室之间更好地理解和比较各自的监测结果,促进国际和跨部门的合作,朝着建立高效的 “一体化健康”(One Health)食源性病原体监测框架迈进。

在研究方法上,研究人员首先收集了大量的食源性病原体样本,涵盖了多个物种的众多菌株。他们对样本进行测序,然后使用多种生物信息学流程进行分析。这些流程包括基于等位基因的流程,如 chewieSnake、INNUENDO-like 等,以及基于单核苷酸多态性(Single Nucleotide Polymorphism,SNP)的流程,如 snippySnake、CSI Phylogeny 等。研究人员还利用了传统的分型方法,如多位点序列分型(MultiLocus Sequence Typing,MLST)和血清型分型,与 WGS 的结果进行对比。此外,他们通过计算各种指标,如调整华莱士系数(Adjusted Wallace Coefficient,AWC)、调整兰德系数(Adjusted Rand Coefficient,AR)等,来评估不同流程之间的聚类一致性。

下面详细介绍研究结果:

  • 研究设计和一致性分析策略:多个欧洲实验室使用不同的生物信息学流程,对四种食源性病原体的全基因组测序数据集进行分析。通过 ReporTree 工具对不同流程的输出进行统一处理,获取所有可能距离阈值下的聚类信息,并使用单连锁层次聚类(Single-Linkage Hierarchical Clustering,HC)或最小生成树(Minimum Spanning Tree,MST)方法进行聚类分析。
  • 各病原体的分析结果
    • 单核细胞增生李斯特菌:基于等位基因的流程在聚类模式上总体相似,但在高分辨率区域(爆发水平)稳定性较低。与传统分型方法(如 ST 和 CC 分型)相比,发现了良好的对应关系。不同基于等位基因的流程之间以及基于 SNP 的流程之间,在大多数情况下聚类结果具有较高的一致性,但与基于等位基因的流程相比,基于 SNP 的流程在使用相同 ST 参考进行读长映射时,往往具有更高的分辨率。在爆发检测方面,通过灵活调整阈值,可以提高不同流程检测到相同爆发信号的概率。
    • 肠炎沙门氏菌:基于等位基因的流程在聚类模式上也较为相似,但 MentaLiST 工具表现出异常行为,被排除在后续分析之外。与传统分型(血清型和 ST 分型)相比,发现了不同程度的一致性,且存在多系血清型。不同基于等位基因的流程之间总体一致性较高,但基于 SNP 的流程在样本包含 / 排除标准上存在差异,影响了其与其他流程的一致性评估。在爆发检测中,使用动态阈值(如 14 ADs)时,不同流程检测到的聚类具有较高的相似性,且通过灵活调整阈值可以进一步提高一致性。
    • 大肠杆菌:由于 Bionumerics 和 SeqSphere 在样本保留率上存在问题,部分分析排除了这两个工具。基于等位基因的流程在聚类模式上存在一定差异,SeqSphere 表现出偏离模式。与传统分型(血清型和 ST 分型)相比,受数据集偏倚影响,结果需谨慎解读。不同基于等位基因的流程之间一致性较高,但 SeqSphere 在所有阈值水平上显示出更高的分辨率。在爆发检测中,使用动态阈值(如 9 ADs)时,不同流程检测到的聚类具有较高的一致性,且核心 SNP 和 cg/wgMLST 分析在 O157:H7 爆发检测中具有等效性能。
    • 空肠弯曲菌:不同的 cgMLST 模式大小导致不同流程的聚类模式存在明显差异,使用 PubMLST 模式的流程显示出更高的分辨率。与传统分型(CC 和 ST 分型)相比,CC 分类在基因组规模上对聚类的反映有限,而 ST 分类更具信息性。不同基于等位基因的流程之间一致性较高,但 PubMLST 模式流程的分辨率更高。在爆发检测中,由于不同模式大小差异,聚类一致性在相似模式大小的流程之间更高,且应用动态 wgMLST 方法可提高分辨率。

  • 应用不同组装流程和更新等位基因调用器的影响:研究发现,使用替代组装流程(INNUca)或更新等位基因调用器(chewBBACA)对聚类结果影响较小,表明研究结果具有稳定性。

在讨论部分,研究人员指出,WGS 在食源性病原体监测中的应用虽然取得了显著进展,但要充分发挥其优势,需要采取 “一体化健康” 方法,解决实验室间可比性和数据共享的问题。研究结果表明,不同的 WGS 流程在聚类模式上存在差异,但基于 cg/wgMLST 的流程总体一致性较好,不过空肠弯曲菌是个例外。此外,即使聚类一致性较高的基于等位基因的流程,在爆发检测中也存在差异,灵活调整阈值可以提高检测相同爆发信号的概率。同时,研究还发现不同的 ST、CC 和血清型具有不同的遗传异质性,这对于选择用于常规 WGS 监测的分离株具有重要意义。最后,研究强调了持续进行 WGS 流程比较研究的必要性和可行性,这将有助于推动全球食源性病原体监测技术的发展,促进 “一体化健康” 利益相关者之间的沟通与合作。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号