基于注意力机制与数据增强的UNet+ConvNeXt Tiny架构在乳腺肿瘤分割中的优化作用研究
《Scientific Reports》:The role of data augmentation and attention mechanisms in UNet and ConvNeXt architectures for optimizing breast tumor segmentation
【字体:
大
中
小
】
时间:2025年11月25日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对乳腺超声图像中肿瘤分割精度不足的问题,系统探讨了UNet+ConvNeXt Tiny架构中数据增强、注意力机制和丢弃率的组合优化策略。通过BUSI和BUS-UCLM数据集验证表明,注意力机制显著提升F1分数、Dice系数等指标,而数据增强需与注意力模块协同使用方能发挥正向作用。该研究为医学影像分割提供了可复现的轻量级解决方案,对临床辅助诊断具有重要参考价值。
在全球女性健康领域,乳腺癌始终是威胁最大的恶性肿瘤之一。早期诊断和精准治疗是提高患者生存率的关键,而医学影像技术在其中扮演着不可或缺的角色。超声成像因其无创、实时、成本低等优势,成为乳腺癌筛查的重要工具。然而,乳腺超声图像存在组织异质性高、噪声干扰大、肿瘤边界模糊等问题,使得手动分割工作既耗时又易受主观因素影响。
近年来,深度学习技术为医学图像分割带来了革命性突破。其中,U-Net架构凭借其独特的编码器-解码器结构和跳跃连接设计,在医疗影像分割任务中表现出色。但传统U-Net在特征提取和关键区域聚焦方面仍有提升空间。注意力机制的引入,使模型能够像人类视觉系统一样选择性关注重要区域,从而提升分割精度。与此同时,数据增强技术通过生成多样化训练样本,增强了模型的泛化能力。然而,这些技术如何协同作用,特别是在乳腺超声图像分割这一特殊任务中的最优配置方案,仍有待深入探索。
本研究创新性地将ConvNeXt Tiny作为U-Net的编码器,构建混合分割架构,系统评估了数据增强、跳跃连接、注意力机制和丢弃率对乳腺肿瘤分割性能的孤立和组合影响。研究团队在BUSI数据集上训练了14种不同配置的模型,并在BUS-UCLM数据集上进行跨数据集验证,全面分析了过拟合行为、精度-召回权衡以及不同设计选择下的鲁棒性。
关键技术方法包括:使用预训练的ConvNeXt Tiny作为特征提取骨干网络;在解码器路径的三个关键位置部署注意力框(结合注意力门和挤压激励模块);采用Dice损失函数解决类别不平衡问题;应用旋转、平移、剪切等数据增强策略;通过早停法和不同丢弃率(0.2 vs 0.5)控制过拟合。
研究采用U-Net为基础框架,其编码器部分替换为ConvNeXt Tiny模型,该模型基于ImageNet预训练权重初始化,充分利用了迁移学习的优势。解码器部分通过上采样操作恢复空间分辨率,并结合跳跃连接传递高频细节信息。特别值得注意的是,研究团队在解码器路径的三个关键位置部署了注意力框,每个框包含注意力门(AG)和挤压激励(SE)模块,分别实现空间和通道维度的自适应特征重校准。
注意力框1位于最深层的解码器级别,空间分辨率最低但语义信息最丰富;注意力框2应用于中间解码器级别,特征更为细化但仍保持语义相关性;注意力框3靠近最终解码层,专注于全分辨率空间细节。这种分层注意力设计使模型能够在不同尺度上捕捉肿瘤特征,其中注意力门通过门控机制抑制不相关区域,而挤压激励模块则动态调整各通道的权重分配。
模型训练采用Adam优化器,初始学习率为1e-4,并配合指数衰减策略。为避免过拟合,设置了验证损失连续10轮无改善则提前终止训练的机制。评估指标全面覆盖了分割任务的关键方面:Dice系数和IoU(Intersection over Union)衡量分割重叠度;精确度和召回率分别评估假阳性控制和真阳性检出能力;F1分数综合平衡精确度与召回率。
在BUSI数据集上的实验结果表明,注意力机制与适当丢弃率的组合对模型性能产生显著影响。最佳性能模型为"UNet+ConvNeXt Tiny+注意力框2+跳跃连接+丢弃率(0.5)",该配置在F1分数(0.557)、Dice系数(0.557)和IoU(0.389)上均取得最高值,体现了精确度与召回率的良好平衡。
数据分析显示,单纯使用数据增强(模型2)反而导致性能下降(损失0.534,精确度0.395),表明增强产生的图像变形可能引入噪声。而注意力机制的引入显著改善了特征选择能力,特别是当与适度丢弃率结合时,模型表现出更强的泛化能力。高丢弃率(0.5)在多数情况下优于低丢弃率(0.2),尤其在抑制过拟合方面效果显著。
在BUS-UCLM数据集上的跨域评估进一步验证了模型的鲁棒性。模型9(无数据增强+注意力框2+丢弃率0.5)表现最佳,准确度达0.941,Dice系数为0.278,显著优于其他配置。值得注意的是,包含数据增强的双注意力框模型(模型5)在精确度(0.226)和Dice系数(0.248)上也表现良好,说明多注意力机制与增强策略的协同作用。
统计显著性检验证实,最佳模型与其他配置之间的性能差异具有统计学意义(p<0.05),表明观察到的改进并非随机波动。此外,推理时间分析显示,所有模型均能在94-130ms内完成单张图像分割,满足临床实时性要求。
研究特别探讨了数据增强的局限性,发现激进几何变换(如20°旋转、20%剪切)可能扭曲超声图像中的解剖结构,导致分割质量下降。轻度变换(±10°旋转、±10%缩放)可带来轻微性能提升,而重度变换则使Dice系数降低0.012-0.038。这一发现强调了医学影像增强中保持解剖合理性的重要性。
本研究通过系统实验证实,UNet+ConvNeXt Tiny架构结合注意力机制和优化丢弃率,可显著提升乳腺超声图像分割性能。注意力机制通过空间和通道维度的特征重校准,有效提升了模型对肿瘤区域的聚焦能力;0.5的丢弃率在多数情况下提供了正则化与特征保留的最佳平衡;而数据增强需谨慎使用,与注意力模块协同方能发挥正向作用。
这些发现对临床实践具有重要指导意义:首先,为乳腺肿瘤的自动分割提供了可复现的轻量级解决方案;其次,明确了注意力机制在医学影像分割中的关键作用;最后,强调了领域特定数据增强策略的必要性。该研究框架兼顾计算效率与分割性能,为未来稳健深度学习在临床影像中的应用提供了明确方向。
研究局限性包括仅测试两种丢弃率值,未来可探索更精细的正则化策略;同时,注意力框的最优数量和位置组合仍有优化空间。尽管如此,该工作为医学影像分割的架构设计提供了宝贵见解,推动了深度学习在乳腺癌诊断中的实际应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号