编辑推荐:
为解决肺部疾病精准诊断难题,研究人员开展基于深度学习的多类肺疾病检测研究。构建融合 VGG16 与 CNN 特征、结合 SE 块和自注意力模块的模型,对 6 类肺 X 射线图像分类,在 45,241 例样本中验证准确率达 93%,为临床诊断提供新工具。
在医疗影像领域,肺部疾病的精准诊断一直是备受关注的难题。随着空气污染加剧、吸烟等不良习惯的影响,肺炎、肺结核、COVID-19 等肺部疾病的发病率逐年上升,传统依靠放射科医生人工判读 X 射线图像的方式,不仅耗时费力,而且在面对复杂病灶或早期微小病变时,容易出现漏诊或误诊。尤其在资源有限的地区,如何快速、准确地从海量 X 射线图像中识别多种肺部疾病,成为亟待解决的临床痛点。
为突破这一困境,来自相关机构的研究人员开展了一项具有创新性的研究。他们致力于开发一种高效的深度学习模型,以实现对多种肺部疾病的精准分类。研究成果发表在《Engineering Applications of Artificial Intelligence》上,为肺部疾病的智能诊断提供了新的思路和技术支撑。
研究人员采用的关键技术方法主要包括:首先构建包含 45,241 张 X 射线图像的多源数据集,涵盖肺结核、肺炎、COVID-19、正常肺、肺混浊和气胸 6 类样本;在模型架构上,融合视觉几何组网络(VGG16)与卷积神经网络(CNN)进行特征提取,并引入挤压激励块(SE 块)和自注意力模块增强模型对关键特征的捕捉能力;图像预处理环节运用阈值分割、形态学操作、轮廓检测等技术进行图像分割,结合直方图均衡化和数据增强提升模型泛化性能;模型训练采用随机梯度下降(SGD)优化器和分类交叉熵损失函数,经过 500 轮迭代训练。
研究结果
通过一系列实验,研究人员得出以下重要结论:
- 模型分类性能验证:在多类别测试中,该模型对 6 类肺部疾病的验证准确率达到 93%,显著优于传统单一网络架构,证明了 VGG16 与 CNN 特征融合策略的有效性。
- 注意力机制的作用:SE 块通过动态校准特征图权重,使模型聚焦于图像中最具诊断价值的区域,如肺部实变、磨玻璃影等关键病变区域;自注意力模块则通过捕捉长距离特征依赖关系,提升了对复杂病灶结构的识别能力。
- 数据预处理的影响:结合阈值分割和直方图均衡化的预处理流程,有效增强了 X 射线图像的对比度和病变区域清晰度,数据增强技术通过生成多样化样本,降低了模型过拟合风险,进一步提升了泛化能力。
研究结论与意义
本研究构建的深度学习模型成功实现了对 6 种肺部疾病的精准分类,突破了传统研究中二元或三元分类的局限性,为临床提供了更全面的诊断参考。其核心创新点在于将经典的 VGG16 网络与 CNN 结合,通过特征融合和双重注意力机制(SE 块与自注意力模块),在降低计算成本的同时显著提升了分类精度。该模型在大规模多源数据集上的高准确率(93%),表明其具备临床转化潜力,尤其在基层医疗单位或资源有限地区,可作为辅助诊断工具缓解放射科医生的工作压力,提高早期病变的检出率。此外,研究中采用的数据预处理和模型优化策略,为其他医学影像的多分类研究提供了可借鉴的方法论,推动了人工智能在医疗诊断领域的跨学科应用与发展。