编辑推荐:
为解决传统 U-Net 模型在胸部 X 光图像分割中遗漏病理区域的问题,研究人员开展基于 CycleGAN 的胸部疾病分类研究。结果显示,该方法平均准确率达 92.05%,平均 AUC 为 89.48% ,优于以往研究,对胸部疾病诊断意义重大。
在医学领域,肺部疾病是全球健康的重大威胁,每年导致约五百万人死亡,早期诊断对于改善患者预后至关重要。胸部 X 光(CXR)检查因其简单、经济且无创,成为肺部疾病筛查和诊断的常用方法。然而,手动检查 CXR 图像对放射科医生来说既耗时又具有挑战性,因为胸部 X 光图像常包含多种潜在疾病,图像分类属于多标签问题,且许多疾病视觉特征相似,容易导致误诊和漏诊。
为了攻克这些难题,来自国外的研究人员开展了一项极具意义的研究,相关成果发表在《Artificial Intelligence in Medicine》上。研究人员提出了一种基于重建的方法,旨在实现胸部 X 光图像的精准分割和多标签胸部疾病的准确分类。
研究人员使用的主要关键技术方法如下:
- 数据集:采用 ChestX-ray14 数据集,该数据集包含 112,120 张 frontal - view 胸部 X 光图像,来自 30,805 名患者,每张图像标注有 14 种胸部疾病中的一种或多种。
- 方法:首先利用 CycleGAN 模型生成肺部的健康恢复图像,通过图像减法和二值化创建病理掩码;接着使用 PyRadiomics 工具提取放射组学特征,并通过 Hierarchical Cluster Analysis(HCA)和统计检验进行特征选择;最后运用 Random Forest(RF)和 Extreme Gradient Boosting(XGBoost)两种机器学习算法进行图像分类。
研究结果如下:
- 消融研究:对比使用 U-Net 和基于 CycleGAN 的方法生成掩码对疾病分类的影响,发现基于 CycleGAN 的方法能显著提高分类的准确率和 AUC。例如,使用 U-Net 生成掩码时,RF 和 XGBoost 模型的平均准确率分别为 79.15% 和 79.56%,平均 AUC 分别为 74.47% 和 75.63%;而使用基于 CycleGAN 的方法生成掩码时,RF 和 XGBoost 模型的平均准确率分别提升至 88.26% 和 89.52%,平均 AUC 分别提升至 85.54% 和 86.55%。同时,研究还评估了特征选择的影响,结果表明采用场景 2(排除类间共同特征)进行特征选择可显著提高模型性能,RF 和 XGBoost 模型的准确率分别达到 91.16% 和 92.05%,AUC 分别达到 88.92% 和 89.48%。此外,通过 SHAP 方法分析发现,研究中选择的特征与 XGBoost 模型分类决策中影响最大的特征一致,验证了特征选择方法的有效性。
- 与现有方法比较:将该研究的最佳模型与以往研究进行对比,结果显示该研究在 14 种疾病分类上平均 AUC 达到 83.12%,优于现有方法。在 7 种疾病(肺不张、实变、胸腔积液、浸润、结节、胸膜增厚、肺炎)上取得了最高的 AUC 分数,与其他研究相比有显著提升。
研究结论和讨论部分表明,该研究提出的基于 CycleGAN 的分割方法能够准确生成包含病理区域的掩码,有效提取与疾病相关的放射组学特征,结合精心设计的特征选择方法,显著提高了胸部疾病分类的准确性。尽管研究存在一些局限性,如 CycleGAN 生成图像的质量有待提高、分类性能可进一步优化、研究结果的普适性需增强等,但该研究为医学图像分析领域提供了一个强大的框架,有助于推动计算机辅助诊断技术的发展,为胸部疾病的精准诊断和治疗提供了新的思路和方法,对改善患者的治疗策略和预后具有重要意义。