基于深度主动学习的胸部X光肺病严重程度分类:在类别不平衡下的少样本学习策略

《Journal of Imaging Informatics in Medicine》:Deep Active Learning for Lung Disease Severity Classification from Chest X-rays: Learning with Less Data in the Presence of Class Imbalance

【字体: 时间:2025年12月11日 来源:Journal of Imaging Informatics in Medicine

编辑推荐:

  本刊推荐:为解决医学影像标注数据稀缺和类别不平衡的挑战,研究人员开展了一项结合深度主动学习与贝叶斯神经网络(BNN)的新冠肺炎胸部X光(CXR)严重程度分类研究。结果表明,使用Least Confidence(二分类)与Mean STD(多分类)采样策略,仅需9.24%和21.87%的标注数据即可达到基线诊断性能(AU-ROC分别为0.95和0.85)。该方法显著降低了标注负担,为临床AI在数据受限场景下的部署提供了可行路径。

  
在全球肺部疾病检出率不断攀升的背景下,胸部X光(CXR)因其普及性高、成本低和诊断价值显著,成为临床筛查的首选成像工具。然而,影像数据量的激增与放射科医生资源短缺之间的矛盾日益突出,导致诊断延迟成为医疗系统的一大痛点。尽管人工智能(AI)辅助诊断工具展现出巨大潜力,但其性能高度依赖大量高质量标注数据,而医学影像标注成本高昂、专业门槛高,严重制约了AI模型的临床推广。此外,医学数据普遍存在类别不平衡问题,即某些疾病或严重程度在数据集中占比极低,这容易导致模型偏向多数类、泛化能力下降。
为此,发表于《Journal of Imaging Informatics in Medicine》的一项研究提出将深度主动学习(Deep Active Learning)与贝叶斯神经网络(BNN)近似方法相结合,在类别不平衡的CXR数据集中实现肺病严重程度的少样本分类。该研究以COVID-19患者的CXR影像为案例,探索如何在保证诊断性能的前提下最大限度降低标注数据需求。
研究人员采用主动学习框架,以蒙特卡洛Dropout(MC Dropout)作为BNN不确定性估计方法,配合加权损失函数缓解类别不平衡的影响。该研究回顾性收集了埃默里医疗系统附属医院963名患者的2319张CXR图像,每张图像由3至6名资深放射科医生独立标注为“正常”“中度”或“重度”。通过多种采样函数(Acquisition Functions)迭代地从未标注池中筛选信息量最大的样本进行训练,并系统比较了其在不同评估指标下的表现。
在技术方法上,作者使用ResNet50架构嵌入MC Dropout层构建BNN模型,采用加权交叉熵损失函数应对类别分布不均(正常14%,中度36%,重度50%)。主动学习过程以每类25张图像随机初始化,每轮增加20张由采样函数选出的样本,直至模型达到全量数据训练的基线性能。评估指标包括准确率、AU-ROC、AU-PRC等,同时记录训练与采样耗时。
Binary Results
在二分类(正常vs.病变)任务中,Least Confidence采样策略仅使用9.24%的训练数据即达到92.8%的准确率(AU-ROC为0.95),其性能显著优于随机采样(17.87%)和复杂采样方法如BatchBALD(9.86%)。该策略在AU-PRC指标上仅需6.78%的数据即可匹配基线水平,显示出对少数类样本的高效学习能力。
Multi-class Results
在多分类任务中,Mean STD表现最优,仅需21.87%的数据即可达到70.5%的准确率(AU-ROC为0.85)。其采样分布分析显示,该方法主动增强了对中度类别(41.8%)和正常类别(30.5%)的采样比例,减少了对主导类别“重度”的依赖,从而有效缓解了类别不平衡带来的偏差。
Comparing Active Sampler with Random Sampling
与随机采样相比,主动采样策略在相同数据量下错误率显著降低(二分类中Least Confidence误分类率为0.072±0.013,随机采样为0.094±0.022;多分类中Mean STD为0.295±0.022,随机采样为0.343±0.023)。这表明主动学习能更稳定地筛选出对模型提升关键的高价值样本。
Sample Distribution and Computational Efficiency Across Acquisition Functions
采样分布分析显示,主动学习函数普遍倾向于对少数类(如正常类)过采样,其中Least Confidence在二分类中对正常类的采样比例达35.7%,Mean STD在多分类中对正常类采样达30.5%。计算效率方面,BatchBALD每轮采样耗时最长(60–70秒),而Least Confidence与Mean STD仅需43–46秒,兼顾了性能与实用性。
研究结论表明,深度主动学习结合BNN不确定性估计与加权损失函数,能在严重类别不平衡的CXR数据集中以不足10%(二分类)或22%(多分类)的标注数据达到全量数据训练的诊断性能。该方法不仅降低了标注成本与时间,还为临床AI在数据稀缺环境下的快速部署提供了可复现的框架。未来工作可扩展至非COVID-19疾病、多中心数据集,并探索与半监督学习等技术的进一步融合。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号