
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Switch-UMamba:基于动态扫描视觉状态空间模型的医学图像分割新架构
《Medical Image Analysis》:Switch-UMamba: Dynamic scanning vision Mamba UNet for medical image segmentation
【字体: 大 中 小 】 时间:2025年09月14日 来源:Medical Image Analysis 11.8
编辑推荐:
本综述推荐Switch-UMamba这一创新混合架构,其融合卷积神经网络(CNN)与状态空间模型(SSM)优势,通过混合扫描机制(Mixture-of-Scans, MoS)动态激活多方向扫描策略,在保持线性计算复杂度的同时显著提升医学图像分割中对长程依赖和空间特征的捕捉能力,为精准医疗提供新范式。
Highlight
Switch-UMamba通过动态混合扫描机制突破传统Mamba模型在二维医学图像中的方向敏感性限制,以稀疏激活方式实现多角度特征捕获,为器官分割、病灶勾画等临床任务提供更优解决方案。
Introduction
医学图像分割是医疗影像分析的核心环节,其精准度直接影响临床诊断与治疗规划。传统人工分割存在主观性强、效率低下等问题,而现有深度学习方法中,卷积神经网络(CNN)虽擅长局部特征提取,却难以建模全局依赖;视觉Transformer(ViT)虽能捕获长程信息,但计算复杂度呈二次方增长。新兴的状态空间模型(SSM)尤其是Mamba架构,以线性复杂度实现长序列建模,但其一维扫描策略难以适应二维图像的空间特性,导致方向敏感性问题。本研究提出Switch-UMamba,通过混合扫描(MoS)机制将不同扫描策略整合为"专家"集合,由路由器动态分配扫描路径,在降低计算成本的同时实现多方向依赖建模。
Medical image segmentation
医学图像分割(MIS)本质上是像素级分类任务,传统方法依赖手工特征(如边缘、纹理),但难以捕捉高层语义信息。随着深度学习发展,基于CNN的U-Net、nnU-Net等模型成为主流,而Transformer类模型(如Swin-UNet)进一步提升了全局建模能力,但计算开销巨大。近期SSM模型通过状态方程(如h'(t)=Ah(t)+Bx(t), y(t)=Ch(t))实现高效序列建模,为医学图像处理提供新思路。
Datasets
实验涵盖多模态医学图像数据:
腹部MRI(AMOS Challenge):包含MRI扫描的13类器官分割;
腹腔镜器械分割:来自EndoVis 2017的手术器械像素级标注;
细胞核分割(MoNuSeg):显微镜图像中的细胞核实例分割任务。
所有数据均涉及复杂结构识别与精细边界划分,充分验证模型泛化能力。
Limitations and future work
当前扫描策略仍依赖人工设计,可能存在冗余与次优分配。未来计划通过可学习扫描策略自动化生成扫描路径,提升资源利用效率与模型性能。
Conclusion
Switch-UMamba成功整合CNN的局部特征提取与SSM的长程依赖建模优势,通过MoS机制实现动态多方向扫描,在多个医学图像分割任务中达到最先进性能,为轻量化高精度医疗影像分析提供新方向。
生物通微信公众号