AI系统在高流行环境下CT扫描中检测活动性结核病的多中心验证研究

《Scientific Reports》:Using AI system to detect active tuberculosis in a high-prevalence setting on CT scans: a multi-center study

【字体: 时间:2025年11月13日 来源:Scientific Reports 3.9

编辑推荐:

  本刊推荐:为解决结核病高负担地区放射科医生短缺、工作负荷重导致的诊断延迟和漏诊问题,研究人员开展了一项利用AI系统在CT图像中识别活动性结核病(ATB)的多中心研究。结果显示,该系统在区分异常与正常、ATB与正常、ATB与非ATB(肺炎、肺结节和正常)以及ATB与其他异常(肺炎和肺结节)四种应用场景下均表现出良好性能,AUC最高达0.996。该研究为在结核病专科医院实施AI以支持临床决策和优化资源利用提供了宝贵见解。

  
结核病(Tuberculosis, TB)至今仍是全球最致命的传染病杀手,而活动性结核病(Active Tuberculosis, ATB)则是疾病传播的主要推手。在结核病高流行地区和资源有限的环境中,放射科医生短缺和工作负荷过重常常导致诊断延迟或漏诊。尽管胸部X线摄影(Chest X-ray radiographs, CXR)和计算机断层扫描(Computed Tomography, CT)是快速方便的筛查和诊断工具,但结核病在CT影像上常表现为实变、结节影、空洞、粟粒样改变和胸腔积液等异质性和复杂的特征,使其难以与其他肺部疾病(如肺炎、肺结节)区分,尤其对经验有限的医生而言挑战更大。此外,影像解读高度依赖放射科医生的专业知识,观察者间差异也时有报道。因此,迫切需要一种更准确的诊断工具来应对这些挑战。
在此背景下,由王倩、张忠发等研究人员在《Scientific Reports》上发表了一项多中心研究,旨在评估一个人工智能(Artificial Intelligence, AI)系统在结核病专科医院这一高流行场景下,利用CT扫描识别活动性结核病(ATB)的可行性和泛化能力。
为了回答上述问题,研究人员开展了一项回顾性多中心验证研究。他们使用了一个名为I-Sight(version 2.0)的、经过预训练的AI系统,该系统基于包含846名患者的CT影像数据集开发,采用U-Net进行ATB病灶检测和分割,并利用聚类方法将2D病灶转换为3D病灶。本研究独立验证了该系统在三个从未参与模型训练的结核病专科医院(医院A、B、C)收集的1741例CT影像数据集上的性能。数据集包含ATB、肺炎、肺结节和正常病例。研究评估了该系统在四种应用场景下的效用和泛化能力:区分主要肺部异常(ATB、肺炎、肺结节)与正常;区分ATB与正常;区分ATB与非ATB(肺炎、肺结节和正常);以及区分ATB与其他异常(肺炎和肺结节)。参考标准结合了细菌学确认(ATB)和放射学共识(其他病例)。性能通过受试者工作特征曲线下面积(Area Under the Curve, AUC)、敏感性、特异性等指标进行评估,并进行了医院间的两两比较。

系统在四种应用场景下的有效性

场景 I:从正常中检测主要肺部异常。 此场景作为分诊步骤,旨在区分异常与正常病例。系统在三个医院均表现出良好性能,AUC分别为0.943(医院A)、0.923(医院B)和0.950(医院C)。
敏感性在0.859至0.959之间,特异性在0.832至0.883之间。结果表明系统能有效优先处理需要立即关注的异常病例。
场景 II:从正常中检测ATB。 此场景用于ATB的针对性筛查。当阳性病例仅为ATB时,系统性能进一步提升,三个数据集的AUC均超过0.95。
敏感性和特异性也达到可比水平(敏感性0.925-0.981,特异性0.955-0.992),表明系统能更准确地将ATB与正常病例区分开。
场景 III:从非ATB中检测ATB。 此场景模拟了更广泛的鉴别诊断情况。当阴性病例包括其他异常和正常时,系统分类性能有所下降。医院A和B的AUC仍高于0.9,而医院C降至0.829。
敏感性和特异性也相应降低。这可能是由于ATB、肺炎和结节在CT影像上具有相似的放射学特征,增加了分类难度。
场景 IV:区分ATB与其他异常。 此场景专注于在无正常病例的情况下区分ATB与其他异常。当阴性病例中排除正常病例后,系统性能进一步下降,尤其是AUC(0.762-0.906)和特异性(0.650-0.863)。
但敏感性保持稳定。分析表明,结节被误判为结核常因病灶内存在结节样病变,而结核被误判为结节则常因结核性肉芽肿的存在。结核与肺炎的相互误判通常归因于斑片状影和树芽征。

系统在四种应用场景下的鲁棒性

为测试AI系统在不同临床环境中的泛化能力,研究比较了三个医院之间的性能。在区分异常或ATB与正常病例时(场景I和II),三个医院在AUC和特异性上无显著差异。
在区分ATB与其他情况的场景(III和IV)中,医院A和B在AUC、准确率和F1分数上无显著差异,但医院C的性能下降更为明显,影响了系统的整体鲁棒性。这可能是因为医院C的CT影像呈现更复杂和模糊的发现,
而医院A和B的ATB病例表现出更典型和一致的放射学特征。

匹配高敏感性目标的性能

在结核病专科医院,高敏感性至关重要。研究测试了在0.8至0.9的高敏感性阈值下系统的特异性变化。结果显示,在大多数场景和医院中,即使敏感性设置为0.9,系统仍能保持良好的特异性,表明系统能够在最小化漏诊风险的同时,避免特异性的大幅下降。

研究结论与意义

本研究验证了一个训练有素的AI系统在三个结核病专科医院检测CT图像中ATB的临床效用。该系统在区分ATB与主要肺部异常(肺炎、结节)方面表现出可接受的性能,AUC范围在0.762至0.996之间,证明了其在结核病高负担环境中应用的潜力。系统的泛化能力在多个未见过的临床环境中得到验证,尤其在区分异常和ATB与正常病例时表现出良好且一致的性能。
该评估为那些希望实施AI以支持临床决策和优化结核病病例激增医院资源利用的实施者提供了宝贵见解。将AI整合到专科结核病医院的工作流程中可以采用不同策略,例如作为第一读者进行预诊断,或作为第二读者为放射科医生提供额外分析层,充当防止漏诊的安全网并减少观察者间差异。这项工作可能是首次尝试探索AI系统在高结核病负担地区识别ATB的有用性,为类似ATB检测工具在更复杂临床环境中的应用奠定了基础。未来的工作包括在更具代表性人群中进行前瞻性验证,将AI系统整合到放射科医生的常规工作流程中,以及在社区和低资源环境中进行评估。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号