《Indian Heart Journal》:Harnessing Semi-Supervised Graph-Based Learning to Advance Automated Bacilli Detection in Digital Tuberculosis Microscopy with Limited Expert Annotations
编辑推荐:
半监督图学习结合少量标注数据和大批未标注显微镜图像,有效提升结核分枝杆菌检测准确性和效率,适用于资源有限地区的自动化诊断。
Pragati Pandit|Sanjay Thorat|Shilpy Singh|Sejal D’mello|Geeta Padole Gaikwad|Raykhan Razakova|Yunus Jumaniyozov
印度纳希克Jawahar教育协会技术、管理与研究学院信息技术系
摘要
在缺乏专家注释的社区或人群中,利用数字显微镜自动检测抗酸杆菌(AFB)对于改善结核病诊断非常重要。在本文中,我们提出了一种基于半监督图的学习方法,并有效利用了少量标记图像和大量未标记的高分辨率涂片显微镜图像。该方法通过图像的图表示来传播标签信息,并使用具有软约束的平滑图扩散算法来减轻标准方法传播的错误。实验结果表明,即使在专家注释有限的情况下,该框架也能稳健且精确地定位杆菌,其整体准确性和F1分数具有很高的竞争力。这些发现表明,该方法适用于资源匮乏环境中的快速、可扩展的AI驱动结核病诊断,并表明半监督学习在减少手动注释需求的同时能够支持数字病理工作流程。
引言
结核病仍然是全球主要的公共卫生挑战,特别是在资源有限的情况下,由于涂片显微镜检查速度慢且存在主观误差以及训练有素的注释者短缺,及时可靠的诊断可能会受到限制[5]、[10]、[13]。深度学习和半监督方法的最新突破使得通过Ziehl–Neelsen染色自动检测玻片上的杆菌成为可能,然而可扩展的系统受到专家标注数据需求(以及人工审查成本)以及不同样本之间染色差异巨大的阻碍[4,8,10,15]。本文通过应用基于半监督图的学习方法来解决这一问题,旨在改进更稳健的自动化系统,以便通过数字显微镜图像检测杆菌。
方法部分
材料与方法
本研究使用了来自知名数据库的经过Ziehl–Neelsen染色的痰液涂片显微镜图像数据集,这些数据集包含了已知阳性和阴性杆菌样本。实验环境被定制为模拟资源匮乏实验室的工作条件,工作条件符合实际诊断质量的变化以及标准操作程序。图像的获取、预处理和分析均在受控的数字环境中进行。
结果
我们提出的半监督方法在自动检测杆菌方面的玻片准确率为0.94,F1分数为0.93。即使面对混合类别和严重不平衡的类别,这一性能也相当稳健。其中95个为真阳性,7个为假阳性,假阴性和真阴性各有一个。与近期文献相比,该方法的性能至少相当,甚至优于许多提出的深度学习方法。
比较分析
该表(3)比较了所提出模型与近期文献在涂片显微镜和胸部X光检测结核病方面的性能指标。
与现有的弱监督和深度学习方法相比,在玻片级准确性和F1分数方面,我们的半监督图基模型具有竞争力。尽管在某些方面与全玻片监督框架和变换器架构相当或更优
讨论
所有这些结果表明,所提出的基于半监督图的方法在没有专家注释帮助的情况下具有很高的稳健性,适用于低流行率的玻片级应用。在低流行率情况下,这些发现表明该框架可用于资源匮乏环境中的结核病诊断。由于这种方法不需要人工输入,它可以通过标签传播利用无监督数据。然而,尽管我们的算法显著优于各种前沿的全玻片方法
结论
总之,我们的研究表明,通过标签传播进行的基于图的半监督学习,仅需最少的专家投入,就可以在数字结核病显微镜应用中实现大量抗酸杆菌的自动检测,从而无需依赖数量有限的标注数据。对模型中的平滑标签扩散施加软约束可以提高模型的稳健性,这可能有助于实现
未引用的参考文献
[1]; [2]; [3]; [7]; [9]; [11]; [12].
伦理批准
作者确认本研究符合伦理标准。未对患者进行任何直接干预,仅使用了来自已批准数据库的匿名数据。遵循了所有相关的机构和国际研究诚信及数据保密指南。
AI使用声明
作者确认没有使用任何AI工具来生成或辅助撰写手稿。所有内容均由作者本人制作和验证。利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。