综述:基于机器学习的无症状高危人群结核病早期检测

【字体: 时间:2025年10月12日 来源:Indian Heart Journal 1.8

编辑推荐:

  本文提出了一种结合对比预训练与微调视觉变换器(CPT-TB)的机器学习框架,用于无症状高危人群的结核病(TB)早期检测。该方法在公开胸片数据集上取得了优异性能(AUC达98.2%),其自注意力机制能有效捕捉全局影像特征,为资源有限地区提供了一种高精度、可解释的自动化筛查方案。

  
基于机器学习的无症状高危人群结核病早期检测
摘要
结核病(TB)仍然是全球重大的健康挑战,尽管经过数十年的防控努力,每年仍影响数百万人。该疾病可在高危人群(如家庭接触者、免疫功能低下者及拥挤环境居住者)中长期潜伏且无症状。这些隐性病例的延迟检测助长了持续传播。胸部X射线成像虽广泛用于筛查,但早期结核病的放射学征象细微,易与其他肺部疾病混淆。训练有素的放射科医生短缺、主观判读以及数据有限进一步加剧了诊断难度。深度学习的最新进展使得自动检测成为可能,但传统的卷积神经网络(CNN)通常需要大量标注数据集,且难以捕捉图像中的全局上下文信息。本文提出了一种结合对比预训练与微调视觉变换器(ViT)的机器学习框架(CPT-TB),用于无症状高危人群的结核病早期检测。
引言
结核病长期以来位居主要传染病死因之列,由空气传播的结核分枝杆菌(Mycobacterium tuberculosis)引起,主要侵袭肺部,可潜伏多年。据估计,全球约四分之一人口感染结核菌。世界卫生组织(WHO)报告指出,2020年全球有近千万新发结核病例,其中东南亚地区占近半数。许多病例悄然进展,超过一半的确诊患者在诊断前无任何症状。这种无症状携带在结核病患者的家庭接触者、免疫抑制个体、HIV感染者以及人口密集环境居住者中尤为常见。由于这些个体 unaware of their infection,他们持续传播细菌,削弱了防控努力。因此,在这些高危群体中进行早期检测至关重要。
胸部X射线摄影长期以来被用作结核病筛查的一线工具,并在大规模主动病例发现活动中发挥核心作用。X射线设备相对便宜、便携,可快速成像。然而,判读X光片需要相当的专业知识。与早期结核病相关的细微阴影、浸润灶和结节可能模仿其他肺部疾病,且判读者间存在显著差异。误判可能导致漏诊或不必要治疗。全球范围内,特别是在资源有限地区和农村地区,熟练放射科医生的短缺使问题更加复杂。计算机辅助诊断系统已被开发用于辅助临床医生,但许多系统依赖于严重依赖手工特征的传统机器学习方法。这些方法难以处理胸部X光片中存在的复杂变异,且往往无法跨人群泛化。
近年来,深度卷积神经网络(CNN)通过从数据中学习分层表征,在图像分类方面取得了显著成功。在医学影像领域,这一进展导致了肺结节、肺炎等疾病的自动检测。基于CNN的结核病筛查系统已被提出,但它们需要大量标注数据才能达到高精度,且可能关注局部纹理而非全局模式。从ImageNet等自然图像数据集中进行迁移学习部分缓解了小数据集问题,但自然场景与医学图像之间的不匹配限制了其有效性。
高危人群通常生活在助长结核病传播的条件下,可能直到疾病进展才出现症状。传染性患者的家庭接触者、医护人员、HIV感染者、囚犯、移民以及医疗服务获取有限的社区尤其脆弱。在这些群体中,建议进行无症状筛查,以预防潜伏感染发展为活动性疾病。使用数字X射线摄影进行无症状筛查已被提倡作为大规模识别的实用策略。然而,这需要快速准确地判读大量图像。人工判读成为瓶颈。能够模拟经验丰富放射科医生的计算机算法可以扩大筛查能力并减少漏诊,但它们需要能够适应图像质量、设备和患者人口统计学的变异。
另一个挑战是结核病表现的多样性。早期病变可能小而弥漫,表现为模糊阴影或肺纹理的细微变化。此类模式易与正常解剖变异、既往感染疤痕或纤维化等良性病变混淆。部分患者,尤其伴有糖尿病或HIV等合并症者,可能出现非典型放射学征象。由于本研究所用数据集中结核病例数量有限,未能涵盖疾病全谱。这种稀缺性凸显了表征学习方法的重要性,该方法需能泛化至特定训练示例之外。自监督预训练通过对比同一X光片的不同增强视图来学习通用图像特征,使模型能够适应新病例。
变换器(Transformer)最初在自然语言处理中引入,用于处理长程依赖关系。视觉变换器(ViT)将图像分割为不重叠的图块,将每个图块投影为嵌入向量并添加位置编码以保留空间信息。这些嵌入通过一堆多头自注意力层和前馈网络进行处理。自注意力机制计算所有图块之间的两两相似性,允许每个图块同时关注其他所有图块。这种全局感受野有助于模型捕捉肺部空间关系,如浸润灶或空洞的相对位置。与依赖局部卷积滤波器并逐渐扩大感受野的CNN不同,变换器可在单层内整合上下文。这一特性在医学影像中尤为有益,因为细微异常可能散布于图像各处,需要整体分析。
对比预训练通过提供强初始化来补充变换器架构。在预训练期间,同一图像的两个随机增强构成正样本对,而批次中的其他图像作为负样本。应用随机裁剪、水平翻转、旋转和亮度调整等增强技术,以鼓励对常见成像变化的鲁棒性。网络学习最大化正样本对表征之间的相似性,同时最小化与负样本的相似性。预训练后,使用标准分类损失在标注数据集上对网络进行微调。该策略减少了过拟合,加速了收敛,并提高了识别细微模式的能力。在标签稀缺且获取昂贵的医学影像领域,对比学习是一个有前景的途径。
方法
我们提出的CPT-TB框架结合了对比预训练与微调视觉变换器,用于从胸部X光片中检测结核病。该方法首先使用公开的Kaggle结核病数据集,该数据集包含4200张图像,其中3500张正常X光片和700张结核病患者图像。第一阶段,未标注图像经过两种不同的增强,并用于对比预训练,学习对常见成像变化鲁棒的表征。随后,在标注数据部分对具有自注意力机制的变换器架构进行微调。注意力机制聚合整个肺野的信息,捕捉CNN难以学习的细微病理模式。
评估指标
为评估性能,我们计算了准确率、灵敏度(真阳性率)、特异度(真阴性率)、精确度、F1分数和受试者工作特征曲线下面积(AUC)。
结果
所提出的CPT-TB模型在各项指标上均优于ResNet-50和ViT-B/16基线模型,实现了98.2%的AUC和95.5%的准确率。灵敏度和特异度均衡,表明其在正确识别结核病例的同时能最大限度地减少假阳性。精确度和F1分数值均高于95%,证实了模型决策的可靠性。与纯监督基线相比的持续增益凸显了将对比预训练作为表征学习策略的有效性。
讨论
结果表明,对比预训练与变换器架构的结合有效解决了结核病检测中的关键挑战。通过从标注和未标注图像中学习,模型克服了数据稀缺和类别不平衡问题。自注意力捕捉了识别弥漫性或细微结核病模式所需的全局上下文。与依赖局部感受野的基于CNN的方法相比,我们的方法减少了假阴性和假阳性。与监督ResNet-50基线相比准确率提高4.0%,与监督视觉变换器相比提高2.3%,这证明了我们方法的优势。
Grad-CAM与注意力图
Grad-CAM和基于ViT的注意力图的加入为了解模型如何聚焦于胸部X光片中临床相关区域提供了宝贵见解。如图4和图5所示,Grad-CAM突出显示与结核病灶一致的上叶局部阴影,而注意力图则强调更广泛的肺实质和肺门周围模式。扩展此类具有多样真阳性、假阳性和临界病例的可视化输出将增强可解释性,使临床医生能够理解模型决策并建立信任。
结论与未来方向
所提出的CPT-TB框架证明,结合对比预训练与微调变换器可显著改善无症状高危人群中结核病的早期检测。通过利用未标注数据和学习全局表征,该模型实现了95.5%的准确率和98.2%的AUC,分别以4.0%和2.3%的优势优于ResNet-50基线和监督视觉变换器。高灵敏度和特异度表明可以在最小化假阳性的情况下检测出结核病例。注意力图为模型决策提供了可解释的见解。未来的工作将探索更大的多中心数据集、三维卷积神经网络(3D CNN)用于CT影像,以及将模型扩展到其他肺部疾病。该框架有潜力集成到便携式筛查设备中,助力实现世界卫生组织终结结核病战略的目标。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号