融合多尺度自适应Swin Transformer与嵌入注意力的精准肺结节检测与分类多阶段深度学习框架

《Scientific Reports》:Multi-phase deep learning framework with Multiscale Adaptive Swin Transformer and embedding attention for precision lung nodule detection and classification

【字体: 时间:2025年12月14日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对肺癌早期诊断中肺结节精准检测与分类的临床挑战,提出了一种集成SEPE预处理、增强DeepLabv3+分割和MA-SwinT分类器的多阶段深度学习框架。通过MEAM机制实现多尺度特征自适应融合,并采用FOA算法优化超参数,在LUNA16和LIDC-IDRI数据集上分别达到98.75%/98.92%的Dice系数和98.17%/98.31%的分类准确率,为临床提供高精度CAD工具。

  
肺癌是全球癌症相关死亡的主要原因之一,早期发现肺结节对提高患者生存率至关重要。低剂量计算机断层扫描(LDCT)虽能提供详细肺部影像,但区分良恶性结节仍面临巨大挑战:结节形态相似度高、周围组织复杂、放射科医生诊断存在主观差异。传统计算机辅助诊断(CAD)系统在处理复杂强度变化区域和小尺寸结节时性能有限,且现有深度学习框架往往缺乏预处理、分割、分类的端到端集成,难以适应临床诊断的精准化需求。
为突破这些技术瓶颈,印度Samayapuram工程技术学院的Dhayalini M与Revathi alias Ponmozhi教授在《Scientific Reports》发表研究,提出了一种创新的多阶段深度学习框架。该研究通过系统整合先进预处理技术、注意力引导分割网络和自适应Transformer分类器,实现了肺结节分析流程的全面优化。
研究团队采用三大核心技术方法构建分析管道:首先使用稀疏边缘保留增强(SEPE)技术进行CT图像预处理,通过自适应梯度加权强化结节边界特征;随后采用改进的DeepLabv3+架构进行分割,集成空洞空间金字塔池化(ASPP)和精炼边界解码器(RBD)模块,支持EfficientNetV2等多种预训练骨干网络;最后设计多尺度自适应Swin Transformer(MA-SwinT)分类器,结合多尺度嵌入注意力机制(MEAM)实现特征自适应融合,并引入以捕食行为为灵感的新型Fossa优化算法(FOA)进行超参数自动调优。实验基于LUNA16(888例CT扫描)和LIDC-IDRI(1,018例CT扫描)两大公开数据集,严格按患者级别划分训练集(70%)、验证集(15%)和测试集(15%)。
分割性能验证
在LUNA16数据集上,以EfficientNetV2为骨干的分割模型表现出色:Dice系数达98.75%,交并比(IoU)为97.88%,杰卡德指数89.62%,豪斯多夫距离仅2.025毫米。可视化结果清晰显示模型能准确勾勒不同形态的结节边界,特别是对不规则形状和低对比度区域的识别效果显著。
在更具挑战性的LIDC-IDRI数据集上,模型表现进一步提升:Dice系数达到98.92%,IoU为98.21%,杰卡德指数90.15%,豪斯多夫距离缩短至2.010毫米。对比实验表明EfficientNetV2骨干网络在四种测试架构中性能最优,其密集连接和复合缩放机制能有效捕捉结节的多尺度特征。
分类性能分析
分类阶段结果同样令人瞩目:LUNA16数据集上准确率98.17%,精确度98.40%,召回率97.90%,F1分数98.15%,特异性98.45%。混淆矩阵显示良性结节识别正确率98.52%,恶性结节识别正确率97.82%,误分类率均低于2.2%。
LIDC-IDRI数据集上分类指标进一步提升:准确率98.31%,精确度98.55%,召回率98.10%,F1分数98.32%,特异性达98.60%。五折交叉验证结果显示各折指标标准差均小于0.11,证明模型具有卓越的稳定性和泛化能力。
消融实验与对比研究
通过逐步添加模型组件的消融实验,研究人员验证了各技术模块的贡献价值:从基线DeepLabv3+(ResNet-50)到完整框架,准确率从96.92%提升至98.31%。特别是加入混合损失函数(交叉熵+Dice损失)和通道空间注意力模块(CBAM)后,模型边界识别能力和特征选择性显著增强。
与现有先进方法的对比凸显了本研究的创新性:在分割指标上,传统方法最佳Dice系数为97.95%,本研究提升至98.92%;分类任务中,对比方法最高准确率为98.00%,本研究达到98.31%。多尺度自适应Swin Transformer结合嵌入注意力机制的架构设计,在保持计算效率的同时实现了全局上下文建模与局部特征捕捉的平衡。
结论与展望
该研究成功开发了一个端到端的肺结节分析框架,通过SEPE预处理、注意力引导分割和MA-SwinT分类的协同作用,显著提升了CAD系统的诊断精度。FOA优化算法有效解决了深度学习模型超参数调优难题,MEAM机制实现了多尺度特征的智能融合。实验证明该框架在两大权威数据集上均达到领先水平,为肺癌早期诊断提供了可靠工具。
研究同时指出了当前局限:数据集虽具代表性但规模有限,未来需纳入多中心、多扫描仪数据验证临床泛化能力;模型解释性仍有提升空间,集成梯度加权类激活映射(Grad-CAM)等可解释AI技术将增强临床可信度。该框架的模块化设计使其易于扩展至其他医学影像分析任务,为精准医疗发展提供了重要技术支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号