基于废水宏基因组测序的病毒早期检测敏感性推断:一项统计模型研究及其在病原体监测成本效益评估中的应用
《The Lancet Microbe》:Inferring the sensitivity of wastewater metagenomic sequencing for early detection of viruses: a statistical modelling study
【字体:
大
中
小
】
时间:2025年10月18日
来源:The Lancet Microbe 20.4
编辑推荐:
本研究针对废水宏基因组测序(W-MGS)在病毒检测中的敏感性和成本问题,通过整合多组学数据与流行病学指标,构建分层贝叶斯模型量化了11种人类感染病毒在特定流行率下的相对丰度。研究发现不同研究间病毒相对丰度存在数量级差异,杂交捕获富集面板可使SARS-CoV-2检测成本降低27-29倍,为未知病原体监测提供了经济高效的解决方案。
随着全球新发传染病的频发,早期发现病原体成为公共卫生领域的核心挑战。传统监测手段依赖于临床诊断和特定病原体的靶向检测,难以应对未知病毒的突发威胁。废水监测作为一种非侵入性公共卫生工具,自1939年脊髓灰质炎病毒在污水中的首次鉴定以来,已发展成为涵盖高、中、低收入国家的先进技术。当前大多数废水监测项目采用定量PCR(聚合酶链反应)追踪流感病毒和SARS-CoV-2等病原体,或使用扩增子测序监测病毒变异。然而,这些技术只能检测预设的目标病原体清单。
与之相比,非靶向废水宏基因组测序(Wastewater Metagenomic Sequencing, W-MGS)和杂交捕获测序(如VirCapSeq-VERT)能够检测更广泛的病毒谱系,包括科学界未知的新型病原体。尽管具有这种潜力,W-MGS和杂交捕获测序在生物监测中的应用仍十分有限,主要源于对其敏感性和成本的担忧。虽然多项研究定性评估了废水测序在病毒病原体检测和基因组流行病学中的应用,但尚未有研究在控制社区感染率变异的基础上,定量评估非靶向W-MGS的敏感性。这种研究空白与靶向废水监测形成鲜明对比,后者已通过多项定量研究得到充分评估。
为填补这一空白,本研究通过开发分层贝叶斯模型,整合公开可用的宏基因组数据集与多种已知病毒病原体的流行病学数据,旨在评估非靶向和杂交捕获废水测序在病毒监测中的性能。该模型能够预测特定流行率或发病率下病毒在废水中的相对丰度,进而结合参数化成本模型估算W-MGS病原体检测的经济成本。
研究人员通过系统性文献检索筛选出符合三项关键标准的测序研究:生成大规模(>1亿读长对)非靶向shotgun W-MGS数据集;使用适用于病毒广泛富集的样本制备方法;研究区域和时间段内具备高质量公共卫生数据。最终纳入四项研究(三项RNA测序研究和一项DNA测序研究),共481个样本。所有研究均对市政进水进行复合采样(RNA研究采用24小时复合样本,DNA研究采用12小时复合样本),并使用Illumina双端测序技术。样本来源涵盖美国加利福尼亚州、俄亥俄州(2020-2022年)和丹麦哥本哈根(2015-2018年)。
关键技术方法包括:从欧洲核苷酸档案库获取测序数据,使用自定义计算流程(Bowtie2和Kraken2)进行病毒读长识别;收集11种人类感染病毒的 location-specific 公共卫生指标(发病率或流行率);建立分层贝叶斯模型推断公共卫生指标与相对丰度的关系;采用PyStan(v3.10.0)进行模型拟合和评估;基于哈佛Bauer核心设施和Illumina网站的公开定价信息进行成本建模。
病毒相对丰度和分类组成 across studies
分析来自四项研究的481个非靶向W-MGS样本发现,病毒中位相对丰度在研究间存在数量级差异:从Spurbeck等研究中的6.3×10-4到Rothman等研究中的2.0×10-2。人类感染病毒的相对丰度同样变化显著,从Spurbeck等的2.5×10-6到Crits-Christoph等的1.8×10-5。人类感染病毒的分类组成在不同研究间也存在巨大差异,如Caliciviridae(杯状病毒科)读长比例从Crits-Christoph等的9.9×10-3到Rothman等的6.8×10-1。
在控制流行病学指标后,研究发现不同研究间标准化病毒相对丰度估计值(RAi(1%)/RAp(1%))存在显著差异。SARS-CoV-2和诺如病毒显示最大的研究间变异,中位RAi(1%)变化约三个数量级(3.8×10-10至2.4×10-7)。所有RNA测序研究一致显示诺如病毒GI的RAi(1%)显著高于SARS-CoV-2,这与诺如病毒GI主要通过粪-口途径传播的特性相符。
流感A/B和多种慢性感染病毒(如HCV、HPV、HSV-1)在废水数据中丰度极低,在2-4项研究中出现零映射读长。对于这些病毒,研究仍能通过"未检测"信息估算RA(1%)的上限值。其他持续出现的慢性病毒(如HIV、EBV)的RAp(1%)研究间差异通常小于急性RNA病毒。
使用Illumina RVP(呼吸道病毒面板)进行杂交捕获富集显著提高了病毒相对丰度。SARS-CoV-2在富集样本中的检出比例大幅提升(Rothman研究中从24%升至79%)。经流行病学指标校正后,SARS-CoV-2的RAi(1%)在Rothman和Crits-Christoph的富集样本中分别增加65倍和750,000倍。流感A在Rothman研究的13个富集样本中首次被检出,平均相对丰度为7.4×10-7。
将RA(1%)估计值转换为检测所需测序深度时,发现不同研究和病毒间存在巨大差异。在1%累积发病率(TCI)下,诺如病毒GII的年检测成本估计为52,200-141,000美元,SARS-CoV-2为144,000-1,180万美元。将TCI降至0.01%时,成本增至140,000-591万美元(诺如病毒)和198万-超过10亿美元(SARS-CoV-2)。使用杂交捕获富集后,SARS-CoV-2检测成本显著降低:在0.01% TCI下,Crits-Christoph研究的年成本从198万美元降至69,100美元,Rothman研究从787万美元降至287,000美元,相当于成本降低27-29倍。
本研究通过创新性地整合宏基因组数据与流行病学指标,首次对非靶向和杂交捕获W-MGS在病原体监测中的敏感性与成本进行了定量评估。研究发现,在控制流行病学因素后,病毒相对丰度仍存在数量级差异,表明非流行病学的研究间变异源(如下水道水文特性、实验室方案差异)对W-MGS敏感性具有重要影响。
研究结果强调,精心设计的杂交捕获面板可大幅提高面板内病毒的检测敏感性并降低成本,但可能降低对未知或意外病原体的检测能力。虽然本研究在理解W-MGS生物监测方面迈出了重要一步,但仍存在关键局限:可用测序数据量有限,特别是针对极低丰度病毒;公共卫生数据的质量和一致性有待提高;DNA测序研究中故意富集病毒的数据缺乏。
未来研究有两个主要方向:将本研究的参数估计整合到更先进的成本效益模型中,比较不同病原体检测方法;通过纳入更大的病毒MGS数据集、更高质量的公共卫生数据和额外测序平台来改进参数估计。随着测序成本的持续下降,此类研究将有助于确定在何种情况下非靶向W-MGS适合常规部署。同时,杂交捕获测序作为一种低成本替代方案,可显著提高我们检测和缓解未来病毒暴发的能力。
该研究由Simon L Grimm、Jeff T Kaufman、Daniel P Rice、Charles Whittaker、William J Bradshaw和Michael R McLaren合作完成,所有作者对研究数据具有完全访问权限,并共同承担提交出版的决定责任。研究数据通过欧洲核苷酸档案库公开,所有分析代码可通过GitHub仓库获取。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号