优化mNGS阈值决策提升结核分枝杆菌检测效能:一项诊断准确性研究

【字体: 时间:2025年09月12日 来源:Frontiers in Cellular and Infection Microbiology 4.8

编辑推荐:

  本研究发现,将mNGS(宏基因组下一代测序)检测结核分枝杆菌复合群(MTBC)的阈值优化至每百万读数≥0.05(RPM≥0.05)时,其曲线下面积(AUC=0.873)显著优于传统培养(0.718)、PCR(0.741)及Xpert(0.763)方法。联合诊断策略可进一步提升诊断效能,为结核病(TB)的精准诊断提供新路径。

  

引言

结核病(Tuberculosis, TB)是由结核分枝杆菌复合群(Mycobacterium tuberculosis complex, MTBC)引起的重大公共卫生挑战。尽管过去十年全球结核病发病率有所下降,但COVID-19大流行严重扰乱了结核病防控进程,导致检测和病例通报减少,死亡率上升。2021年全球估计有1060万人感染结核病,相当于每10万人中134例。临床实践中,结核病的诊断和治疗仍面临巨大挑战,亟需开发快速、准确的筛查和诊断方法。

近年来,宏基因组下一代测序(metagenomic next-generation sequencing, mNGS)作为一种补充诊断方法,广泛应用于各种感染性疾病的临床诊断。其优势包括检测时间短、无偏倚检测和半定量能力,能够识别临床样本中所有病原体,特别适用于罕见、新发和非典型感染病原体的诊断。然而,评估mNGS对MTBC检测效能的挑战依然存在,主要由于样本中MTBC基因组拷贝数变异、mNGS方法学及数据分析方法的差异。许多研究未使用半定量指标(如特异性每百万读数,RPM)作为基本参数,或未定义具体的RPM阈值,这阻碍了可比性半定量分析的发展。

方法

研究设计与患者

本研究回顾性纳入了2022年1月至2023年6月永康市第一人民医院收治的疑似肺结核患者。收集了人口统计学信息、临床症状、实验室检测结果、影像学检查结果、诊疗史和结局数据。排除标准包括临床数据不完整或缺乏微生物学结果(如培养、PCR或X-pert)的患者。疑似结核病的标准包括:1)结核中毒症状(如咳嗽、发热、盗汗或体重减轻);或2)影像学特征符合结核病。

结核病病例定义

最终临床诊断标准为微生物学确认阳性。对于无微生物学证据的患者,医生结合影像学和临床表现,排除其他疾病,并经组织病理学确认结核病,且患者抗结核治疗一个月后随访确认有效。根据中华人民共和国卫生部临床指南,结核病病例应符合以下任一标准:1)微生物学结果阳性(包括抗酸染色涂片和培养、X-pert、PCR、mNGS);2)肺活检组织病理结果符合结核病特征;3)抗结核治疗三个月后肺部病变减少或消失。否则归类为非结核病例。

标本采集与实验室流程

支气管肺泡灌洗液(BALF)样本由经验丰富的支气管镜医师通过支气管镜采集,操作遵循标准程序。注入60~100 mL生理盐水冲洗支气管段后回收,合格BALF(至少25 mL)分为5部分,4部分用于传统检测(抗酸染色和培养)、MTB PCR和X-pert MTB/RIF assay,其余部分储存于-20°C,送MatriDx Biotechnology进行mNGS检测。

mNGS流程与分析

mNGS工作流程包括四个步骤:样本处理、核酸提取、文库制备和生物信息学分析。所有湿实验室和计算机程序均遵循锁定的标准操作程序(SOP)和明确的质量控制指标。DNA从组织预处理后的上清液中提取,使用磁珠法(Genskey Co., Ltd., China)。DNA浓度定量和归一化后,使用NEBNext Ultra II DNA Library Prep Kit for Illumina制备文库,包括酶切片段化、末端修复、条形码连接、文库纯化和PCR扩增。文库质量通过Qubit dsDNA High Sensitivity (HS) Assay Kit评估。合格文库在MGISEQ-200RS平台(MGI, China)上使用MGISEQ-200RS High-throughput Sequencing Reagent Kit (FCL SE50)进行测序。原始测序读数使用fastp软件过滤,去除低质量读数、适配器污染、重复序列和短于50碱基对的读数。与人类参考基因组(hg38)对齐的读数被排除。剩余读数归一化为每样本2000万,进行多序列比对。微生物鉴定通过将过滤后的读数与内部病原微生物基因组数据库比对进行。在数据分析前,临床样本中检测到的微生物首先与平行无模板对照(NTC)中检测到的微生物进行比较。当至少1个读数映射到MTBC(严格映射到属水平序列数)时,结核分枝杆菌被视为阳性。

统计分析

所有收集的数据使用R包进行统计分析。结核病诊断的截断值通过受试者工作特征(ROC)曲线评估。计算曲线下面积(AUC)、准确度(ACC)、灵敏度(SEN)、特异性(SPE)、阳性预测值(PPV)、阴性预测值(NPV)、阳性符合率(PPA)和阴性符合率(NPA),以临床诊断为金标准。ROC曲线比较使用DeLong方法。P值<0.05视为 statistically significant。配对数据的指标(包括SEN、SPE、PPA、ACC、PPV、NPV和NPA)比较使用McNemar精确检验。所有检验均为双侧,显著性水平设为P<0.05。进行决策曲线分析(DCA)评估mNGS阈值(RPM≥0.05)诊断结核病的临床效用,基于170例BALF样本(59例确诊TB,111例非TB)。原始RPM值通过逻辑回归校准转换为连续概率(0-1),评估mNGS概率在阈值概率范围(0%至60%)的净 benefit,与“Treat All”和“Treat None”策略比较。

结果

mNGS检测MTBC的阈值优化

从永康市第一人民医院收集264例疑似肺结核患者的BALF样本,排除临床数据不完整或缺乏微生物学结果的患者后,最终纳入59例临床确诊结核病(TB)和111例临床确诊非结核病(Non-TB)患者。所有170例患者的BALF样本均进行mNGS检测。

mNGS检测的MTBC读数通过相应样本的mNGS数据总量归一化,获得特异性每百万读数(RPM)作为MTBC的半定量基线数据。基于MTBC阳性样本中RPM值的分布特征,选择0.02、0.05和0.10 RPM作为优化阈值。评估各阈值下mNGS对结核病的诊断效能,以临床诊断为金标准。结果显示,RPM阈值≥0.02、≥0.05和≥0.10时,mNGS辅助诊断TB的AUC值分别为0.881、0.873和0.814。t检验表明,RPM≥0.02(P=0.003)和RPM≥0.05(P=0.005)的AUC值显著高于RPM≥0.10。RPM≥0.02和RPM≥0.05的AUC值无显著差异(P=0.317)。考虑到MTBC作为胞内菌的基因组检测挑战和mNGS的固有灵敏度限制,最终选择RPM≥0.05作为后续多方法性能比较研究的阈值。

阈值优化mNGS在MTBC检测中的效能评估

MTBC的mNGS检测阳性判定使用RPM≥0.05阈值。样本分为MTBC阳性和阴性组,基于常规培养、PCR和X-pert方法的结果进行进一步分析。评估这些不同诊断方法及其组合辅助诊断MTBC的效能,以临床诊断为金标准。多方法结核病诊断效能的ROC曲线比较显示,mNGS、常规培养、PCR和X-pert的AUC值分别为0.873、0.718、0.741和0.763。mNGS的AUC显著高于常规培养、PCR和X-pert,P值分别为4.05e-07、5.41e-06和5.15e-05。表明阈值优化mNGS在检测MTBC方面优于常规临床 assay。

进一步探索阈值优化mNGS与常规临床MTBC assay的组合。结果显示,当与常规培养(AUC=0.718)、PCR(AUC=0.741)和X-pert(AUC=0.763)单独组合时,mNGS+常规培养、mNGS+PCR和mNGS+X-pert的AUC值显著更高,分别为0.837、0.868和0.873。这些比较的P值均小于0.05(分别为2.16e-05、8.72e-06和5.15e-05)。使用mNGS+Xpert诊断策略,假阴性病例数从28减少至15,意味着13例额外病例被正确识别,反映诊断灵敏度改善。净正确重分类为13例,对应净重分类改善(NRI)为0.08%,需检测数(NNT)为13.1——意味着每检测13个个体可识别一例额外真实病例。

除AUC外,使用ROC曲线评估各种MTBC assay的效能,基于诊断性能相关附加参数,包括ACC、SEN、SPE、PPV、NPV、PPA和NPA。结果显示,阈值优化mNGS表现优于常规临床MTBC assay(常规培养、PCR和X-pert),具有最高值的ACC(0.912)、SEN(0.746)、SPE(1.000)、PPV(1.000)、NPV(0.881)、PPA(0.746)和NPA(1.000)。 notably,四个参数(ACC、SEN、NPV和PPA)相对于其他 assay 有显著改善。此外,与常规培养、PCR和X-pert单独相比,各种 assay 组合,包括mNGS与常规培养、mNGS与PCR、mNGS与X-pert,也表现出AUC、ACC、SEN、NPV和PPA的显著增强。

DCA曲线显示,橙色曲线(RPM≥0.05)在约5%至35%阈值概率范围内优于其他策略(Treatment All和Treatment None),表明在此范围内具有最高临床净 benefit。红色虚线标记RPM≥0.05阈值,落在最优净 benefit 区域内,确认其有效性。低于5%,橙色曲线与Treatment All策略紧密对齐,表明此范围内高假阳性率。高于35%,橙色曲线保持比Treatment None更高的净 benefit,显示RPM≥0.05仍比无治疗更有益。橙色曲线在40%以上保持稳定且高于Treatment None线,表明即使在高阈值概率下也具有一致临床价值。

讨论

结核病严重威胁人类健康,因此其精准诊断和治疗备受关注。常见结核病诊断方法包括结核菌素皮肤试验、TSPOT.TB assay、抗酸染色、分枝杆菌培养和分子诊断技术如PCR和X-pert MTB/RIF。然而,培养技术的挑战以及常规方法灵敏度和特异性的限制, often 导致这些测试无法及时满足临床需求。因此,亟需开发快速、便捷、准确且成本效益高的先进精准诊断方法和体外诊断产品用于结核病。

如所知,mNGS被视为识别病原微生物的重要补充诊断方法。这种方法能够快速筛查难培养或罕见微生物,以及及时识别已知病原体如结核病,并检测耐药基因。 indeed,mNGS已广泛应用于病原微生物诊断和指导临床治疗,涉及中枢神经系统感染、肺部感染、血流感染、眼部疾病和免疫缺陷患者感染。多项临床应用研究表明,mNGS增强MTBC的临床检测,并为结核病提供辅助诊断价值,相较于常规诊断方法。尽管宏基因组下一代测序(mNGS)快速发展且临床应用日益增多,数据分析和临床解读仍面临若干主要挑战。这些包括缺乏标准化工作流程和质量控制措施、高宿主DNA背景和有限微生物生物量的干扰、解读大量复杂数据的困难、当前数据库和生物信息学流程的限制,以及需要将测序结果与临床背景有效整合。关键问题包括如何确保同一病原微生物在不同样本间mNGS数据的可比性,以及如何为相同病原体的mNGS结果阳性判定建立适当阈值。这些问题为临床医生在疑似结核病患者解读mNGS数据带来 substantial 挑战,且在现有研究中似乎未得到充分解决。

为解决mNGS检测MTBC的挑战,本研究分析了患者BALF样本中MTBC的RPM及其与临床结核病诊断作为金标准的相关性。进行了一项回顾性队列研究,包括59例临床诊断结核病和111例诊断非结核病患者。我们的研究证明了mNGS使用BALF标本对肺结核的高诊断性能(AUC=0.873),这与先前发现一致,如研究。独立队列间的这种相似性支持mNGS在不同临床环境中的可重复性和泛化性。两项研究均使用BALF样本在结核病疑似患者中应用mNGS,表明该技术的稳定诊断能力。尽管研究设计存在差异——包括样本量[我们的研究170例对322例]、参考标准和患者纳入标准——诊断准确性的收敛表明mNGS提供稳健性能,无论这些上下文变化。此外,我们还比较了mNGS在最优阈值(MTBC RPM≥0.05)与常规MTBC检测方法(包括培养、PCR和Xpert)的性能。结果表明,优化阈值可以增强mNGS数据的可解读性,使临床医生能够更自信地利用这些信息进行MTBC高效诊断。决策曲线分析显示,我们的模型在临床相关阈值概率范围(0.1至0.6)内提供比“treat all”或“treat none”策略更高的净 benefit,表明其在指导临床决策中的实用价值。

此外,我们还发现mNGS与常规培养组合、mNGS与PCR组合、mNGS与X-pert组合在确定结核病方面表现出比任何常规方法单独更高的效能。这一发现与先前研究一致,而我们的工作提供更具体数据支持这一结论。

临床实践与挑战

将≥0.05 RPM阈值转化为常规流程时,必须权衡三个实际障碍。

a. 周转时间(TAT):我们内部工作流程在24–48小时内(中位数30小时)交付结果,超过Xpert MTB/RIF的2小时。缩短TAT至<24小时通过当日批处理和快速文库制备试剂盒(如Illumina DNA Prep Mx)是可行的,但需要24小时测序核心人员配备。因此,我们提出分层算法:涂片/Xpert用于初始分诊,保留mNGS用于涂片阴性、临床可疑病例,其中延迟TAT可接受。

b. 成本与基础设施:当前每次mNGS测试试剂成本约250美元(文库制备+测序),而对涂片显微镜检查约10美元,Xpert(基于试剂盒)约15–20美元。然而,0.05 RPM阈值的高特异性(100%)有机会通过避免假阳性患者经验性多药治疗抵消下游成本。在缺乏NGS基础设施的低资源设置中,区域测序中心接收快递样本或基于云生物信息学(上传FASTQ到安全服务器)也可以减少资本支出。

c. 平衡灵敏度与特异性以防止过度治疗:选择的0.05 RPM阈值在我们的队列中产生灵敏度74.6%和特异性100%。此截断值的零假阳性率最小化不必要抗结核治疗及其伴随毒性的风险,这是在二线药物资源稀缺环境中的关键优势。

局限性

尽管我们的研究为mNGS检测MTBC建立了初步RPM阈值(≥0.05),必须承认若干局限性。首先,回顾性、单中心设计和中等样本量(n=170)限制阈值在具有 distinct MTBC菌株多样性、HIV流行率或儿童少菌病人群中的泛化性。此外,样本组成可能未 fully 代表罕见共感染或非典型表现患者,需要更大、多中心队列进一步验证。

其次,阈值对其他样本类型(如痰或脑脊液,CSF)的适用性仍不确定。不同样本类型可能表现出 varying 病原体负载和宿主DNA污染水平,这可能影响最优RPM阈值。例如,痰样本可能具有更高细菌负载,而CSF样本可能具有较低病原体浓度。因此,需要进一步研究以确定此阈值是否适用于临床实践中常用其他样本类型。

第三,实验室间可重复性仍未探索;DNA提取试剂盒、测序深度(<20M读数)或生物信息学流程(如k-mer与对齐基于)的变异可能需要在不同实验室和测序平台重新校准阈值。不同测序平台由于深度、错误率和灵敏度差异可能产生 varying 结果,使阈值 potentially 平台依赖。

我们也未评估阈值在免疫缺陷宿主(如移植受者)中的表现,其中非典型细菌负载和共感染可能改变RPM分布。缺乏纵向数据 preclude 评估抗结核治疗期间或跨样本类型(BALF对痰对CSF)阈值稳定性。最后,真实世界实施必须考虑基础设施、周转时间、成本效益和监管验证——这些均未在此正式评估。因此, warrant 在资源受限环境中纳入卫生经济模型的多中心、前瞻性研究。

结论

总之,本研究结果表明,优化mNGS阈值可能增强MTBC临床检测效率,改善结核病准确诊断。这种优化可能带来额外患者益处,包括增加诊断效能、及时性和降低临床成本。最终,此类阈值调整的实施为结核病准确诊断和治疗提供更高效、便捷且成本效益高的技术。为解决这些局限性,我们设计了多中心验证路线图,计划未来进行分阶段多中心验证路线图。阶段1将 engagement TB联盟网络和儿科结核中心 across 高、中、低负担区域招募≥1,000例前瞻性 enrolled 患者(成人、儿童、HIV阳性和免疫缺陷)。标准化SOP——包括相同DNA提取试剂盒、 spike-in controls(ERCC)和≥20 M读数每样本——将分发以最小化站点间变异。并且,我们将进行纵向子研究检查≥0.05 RPM阈值是否保持有效。阶段2将测试阈值在替代平台(Ion Torrent, Nanopore)和降低测序深度(5–10 M读数)典型资源有限实验室的可移植性。阶段3将整合决策分析建模比较mNGS引导与标准诊断算法在每准确诊断成本、周转时间和患者结局方面的表现。同时,将RPM动态纳入卫生经济学模型评估基于RPM的个性化治疗在减少毒副作用和QALY方面的成本效益。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号