基于双域注意力机制和Mamba网络的3D U-net架构,用于多发性硬化病灶的分割
《Journal of Radiation Research and Applied Sciences》:Dual-domain attention Mamba-based 3D U-net architecture for multiple sclerosis lesion segmentation
【字体:
大
中
小
】
时间:2025年11月22日
来源:Journal of Radiation Research and Applied Sciences 2.5
编辑推荐:
多发性硬化症(MS)小病灶的3D-U-Net混合架构融合了频域-空域双域注意力(DDA)、视觉Mamba(ViM)和卷积块注意力模块(CBAM),通过残差单元优化梯度传播,在MSLesSeg 2025数据集上平均Dice系数达0.6529,显著优于传统CNN及Transformer模型。
在医学影像分析领域,尤其是针对多发性硬化症(MS)微小病灶的分割任务,研究人员面临着诸多挑战。这些病灶通常体积小、对比度低、形态复杂,且在常规磁共振成像(MRI)序列中难以识别。传统的图像处理技术与经典机器学习算法虽然在一定程度上提高了分割效率,但它们在处理这类微小病灶时仍存在局限,例如对噪声和部分体积效应敏感,以及在跨数据集泛化能力不足。因此,近年来深度学习技术的引入极大地推动了该领域的进展,特别是U-Net及其多种变体的出现,为医学影像分割提供了强大的工具。然而,U-Net作为一种纯卷积结构,其感受野的局限性导致其在建模长距离空间依赖关系方面存在不足。与此同时,Transformer架构凭借其自注意力机制在自然语言处理领域取得了突破性进展,随后被引入计算机视觉任务,显著提升了模型对全局上下文关系的建模能力。然而,Transformer的高计算复杂度和内存占用限制了其在处理高分辨率医学影像时的可扩展性。基于此,研究者开始探索更高效的模型架构,例如结合U-Net与Transformer的混合模型,以及引入更先进的状态空间模型(SSM)的ViM架构。
本文提出了一种基于传统U-Net的混合三维架构,旨在实现对MS微小病灶的精确分割。该架构通过引入Dual-Domain Attention(DDA)模块、ViM模块以及CBAM模块,有效解决了传统模型在处理小病灶时所面临的挑战。DDA模块通过傅里叶变换提取频率域特征,并结合通道注意力机制优化空间域特征,从而增强病灶边界的表征能力。这种双重域处理方式使得模型能够在不增加过多计算负担的前提下,更好地捕捉病灶的全局结构和局部细节。在瓶颈层,传统卷积操作被ViM模块所取代,后者通过线性复杂度的处理方式,能够高效地建模长距离空间依赖关系。此外,ViM模块采用双向扫描机制,能够在不依赖全局注意力的前提下,实现对整个体积数据的全局感知。这种设计不仅提升了模型的效率,还增强了其对复杂病灶结构的建模能力。
在解码路径中,CBAM模块的引入进一步优化了特征图的细节。CBAM结合了通道注意力和空间注意力机制,通过显式建模特征图中的通道间和空间间依赖关系,使得模型能够更准确地识别病灶区域,同时抑制无关背景信息。该模块特别适用于微小病灶的分割,因为它能够强调重要特征通道和关键空间区域,从而在解码过程中提高分割的清晰度和准确性。此外,为了增强模型的深度和训练稳定性,本文还引入了残差单元,使得模型在处理复杂的病灶结构时能够更好地保持梯度流动,避免梯度消失问题,同时增强模型的表达能力。
本文在MSLesSeg 2025数据集上进行了广泛的实验验证。该数据集涵盖了多种MRI模态(如T1w、T2w和FLAIR),并提供了详细的专家标注,使得模型的评估更加可靠。实验结果表明,本文提出的模型在平均Dice相似度系数(DSC)方面达到了0.6529,优于多种现有的方法,包括传统的3D-UNet、AttnUNet,以及基于Transformer的UNETR和SwinUNETR。此外,该模型在计算效率和内存占用方面也表现出色,其计算复杂度仅为246.478G FLOPs,参数数量为8.157,相较于其他模型更具优势。这些结果表明,本文提出的混合架构在准确性和效率方面都具有显著的提升。
通过消融实验进一步验证了各个模块的有效性。实验结果显示,DDA模块在提升分割精度方面起到了关键作用,其平均DSC提升了约0.6%。而CBAM模块则在解码路径中增强了对病灶特征的关注,特别是在微小病灶的边界识别和细节恢复方面表现出色。ViM模块在瓶颈层的引入则显著提高了模型对长距离空间依赖关系的建模能力,同时降低了计算复杂度。这些模块的协同作用使得本文提出的模型在MS病灶分割任务中实现了优越的性能。
从临床应用的角度来看,本文提出的模型具有重要的价值。它不仅能够提高病灶分割的准确性,还能显著减少放射科医生的工作负担,使得MS病灶的检测和分割过程更加自动化和高效。然而,当前模型在多模态信息融合方面仍有提升空间,例如如何更有效地整合不同MRI模态(如FLAIR、T1w和T2w)之间的互补信息,以进一步提升对微小或模糊病灶的识别能力。未来的研究可以探索更先进的多模态融合方法,如基于自适应注意力的融合机制或跨模态对比学习,从而增强模型的鲁棒性和泛化能力。
综上所述,本文提出的混合三维架构在MS微小病灶分割任务中展现了卓越的性能。通过结合传统U-Net的局部感知能力、Transformer的全局建模优势以及ViM的高效线性复杂度处理方式,该模型不仅能够准确分割病灶,还能够在保持计算效率的前提下实现更高的分割精度。这些改进为医学影像分析领域提供了新的思路,并为未来的临床应用奠定了坚实的基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号