综述：结核病检测对象及其重要性：对诊断算法的启示

《The Lancet Microbe》：Whom tuberculosis tests detect and why it matters: implications for diagnostic algorithms

【字体：大中小】 时间：2025年10月19日 来源：The Lancet Microbe 20.4

编辑推荐：

　　本文系统阐述了结核病诊断检测应超越传统灵敏度（sensitivity）/特异性（specificity）数值评估，强调需关注检测技术所识别的疾病谱（disease spectrum）片段。作者提出以“可检测性阈值”理解检测性能，并分析了多步骤诊断算法中检测结果相关性对总体准确性的影响，为新型检测技术（如舌拭子分子检测、C反应蛋白[CRP]、数字胸片[chest x-ray]）的评估与应用提供了重要框架。

结核病检测对象及其重要性：对诊断算法的启示

结核病并非一种均质性疾病，而是存在于一个多维度的谱系中。这个谱系涵盖了细菌负荷、临床严重程度、免疫反应强度以及获得医疗照护的机会等多种特征，这些特征都与临床结局、流行病学结果以及诊断检测的性能密切相关。传统的诊断准确性评估，即灵敏度和特异性，往往被概念化为随机概率，但实际情况是，个体沿着一个由疾病特征决定的可检测性谱系分布。诊断检测的本质是识别那些疾病特征超过其特定可检测性阈值的个体。因此，理解检测技术所针对的疾病谱片段，对于优化诊断策略至关重要。

检测灵敏度和特异性代表疾病谱的比例

任何诊断检测的灵敏度实际上反映了其能够检测到的结核病患者在总患者群体中所占的比例。这个比例取决于检测方法所依赖的生物学或临床维度。例如，旨在检测呼吸道中结核分枝杆菌（Mycobacterium tuberculosis）的检测方法（如痰涂片显微镜检查、培养、各种痰液快速分子检测以及新型舌拭子分子检测），其灵敏度取决于患者呼吸道细菌负荷超过检测限的比例。而基于宿主反应的检测（如C反应蛋白[CRP]、干扰素-γ释放试验[IGRAs]、转录组学特征），其灵敏度则取决于宿主反应超过特定阈值的患者比例。其他检测维度还包括胸片检测的宏观病理变化，以及尿液脂阿拉伯甘露糖[LAM]检测的肺外或播散性感染。除了生物学因素，社会经济学因素影响下的医疗可及性以及提供诊断标本（如痰液）的能力，也是决定检测对象的重要维度。

疾病谱的不同片段具有不同的健康后果

在设定诊断检测的准确性目标时，需要考虑是否应优先检测某些结核病患者群体。因为检测相同数量的患者，其临床和公共卫生效益可能因被检测者的特征而异。例如，检测呼吸道结核分枝杆菌的检测方法在旨在限制社区内（空气）传播的主动病例发现活动中可能特别有用。相反，检测播散性细菌（如尿液LAM）或测量非特异性但可能有害的宿主反应（如CRP）的检测方法，可能更有效地识别那些将从早期诊断和治疗中临床获益的晚期疾病患者。因此，理想的诊断策略应权衡检测的准确性、可及性以及针对高优先级患者群体的检测能力。

多步骤算法中与疾病谱的 correlated 相互作用

在结核病诊断实践中，检测通常被组合使用。对于有症状患者的诊断，互补的检测可以并行使用以提高灵敏度（例如，同时使用痰液分子检测和尿液LAM）。在无症状人群的筛查中，多检测算法尤为常见，检测通常按顺序应用（作为筛查和确认步骤）以提高特异性。

检测准确性反映了检测疾病表现的能力，因此不同的结核病检测结果常常存在相关性。当检测针对相似的疾病维度时，这种相关性尤其强。例如，各种呼吸道病原体检测方法虽然灵敏度不同，但结果高度相关。即使检测看似不相关的疾病表现，由于疾病过程不同维度之间的内在联系，也可能存在显著的相关性。例如，痰菌负荷较高的个体，平均而言也倾向于有更严重的肺部病理和更强的宿主反应。

这些相关性对组合检测的整体准确性有重要影响。在顺序测试算法（如筛查算法）中，检测间的正相关性会提高算法的灵敏度，但会降低其特异性。而在并行测试算法中，相关性则会降低算法的灵敏度，但提高其特异性。因此，在评估用于算法的检测时，必须表征可能组合使用的不同检测之间的相关性。

人群选择和检测相关性影响特异性

检测的特异性同样受到测试人群以及与其他检测相关性的影响。结核病筛查或诊断检测在未患病者中出现阳性结果的原因多种多样，其中许多可以被理解为在更广泛的、不限于结核病的谱系中的适当结果。例如，非结核性肺部感染可能同时导致呼吸道症状、胸片异常和CRP水平升高。

导致所谓假阳性的机制在不同检测间常常是相关的。这种相关性对多检测算法特异性的影响与对灵敏度的影响类似：相关性提高了并行测试的组合特异性（因为更少的未患病者有任何阳性结果），但不利于顺序筛查算法的特异性（因为在未患病者中，筛查和确认步骤的阳性结果重叠增加）。例如，既往结核病史可能同时增加筛查胸片（由于结核后肺病）和确认性结核分子检测（由于痰标本中残留DNA）出现阳性结果的概率，从而导致算法特异性低于假设检测独立时的预期。

此外，导致假阳性的机制在不同人群中的流行程度不同，从而导致检测特异性存在相应差异。因此，准确估计算法的特异性需要直接在相关测试人群中测量个体检测特异性之间的相关性，或表征目标人群中阳性结果的来源并据此估算联合特异性。

启示与建议

结核病筛查和诊断检测的灵敏度和特异性估计值取决于多个测试步骤和患者选择过程与底层疾病谱的一个或多个维度的对齐程度。这些谱系和背景依赖性对结核病诊断准确性的评估、报告和建模具有重要启示。

首先，诊断准确性研究的设计应有助于将研究结果转化到其他人群。这可以通过表征检测性能与个体特征及其他检测结果的关系来实现。对于实践中可能联合使用的检测，在同一批个体中进行同步评估，可以最清晰地揭示检测间的相互作用。研究应尽可能在定量尺度上记录结果，并围绕反映细菌负荷、临床严重程度等疾病维度的已确立的、特征明确的低成本的检测（比较检测）来评估新型检测。

其次，研究人员应以比通常提供的更细的粒度报告结果。准确性估计值应按疾病严重程度、细菌负荷等指标进行分层，并反映可能的检测组合和使用场景。提供发表时的个体水平数据将允许在推断结果时基于多种疾病指标进行重新加权，从而为后续研究和应用提供更大的灵活性和价值。

第三，在建立和沟通准确性目标（例如在目标产品概况[TPP]中）时，专家和政策制定者应通过明确定义预期的测试场景和目标人群来明确考虑疾病谱。TPP可以指定针对高优先级亚组的单独准确性目标，例如高细菌负荷群体、高风险合并症群体或难以确诊的群体（如儿童）。对于用于多检测算法的检测，高优先级亚组也可以相对于其他检测来定义。最相关的参考标准不一定是最广泛的，而是与预期用途一致或能识别具有高临床或公共卫生相关性的目标人群的标准。

最后，诊断准确性数据的解释者，包括诊断干预的模型构建者，在直接跨人群转移准确性估计值或假设不同检测独立运作时应谨慎。当缺乏目标人群或测试背景的实证数据时，可以通过考虑可能影响性能的关键协变量（如症状流行率、合并症存在情况或细菌负荷水平）的差异来调整来自其他环境的准确性估计值。此外，在建模诊断算法时，必须考虑检测相关性。

结论：将检测置于背景中以最大化其影响

开发新诊断检测的目的是增加增量的临床和公共卫生价值。为了实现这一目标，检测需要准确，并且其准确性应在将被使用的背景下进行评估和解释，包括流行病学环境和诊断算法。特别是对于结核病筛查，其中检测应用于广泛的疾病谱系内并处于多步骤算法中，对准确性的背景敏感考虑需要理解检测如何与疾病谱的多个维度相互作用。明确准确性估计中的人群和参考标准，考虑和建模相关性如何影响算法准确性，以与检测预期用途一致的方式定义准确性目标，以及设计研究以生成和报告关于检测相关性和相互作用的高质量数据，这些行动可以促进开发更高效、更具影响力的结核病诊断算法，有助于缩小诊断差距并减轻全球结核病负担。

热点排行

新闻专题