UM-Mamba:基于螺旋选择性扫描的医学视觉状态空间模型在医学图像分割中的高效应用

【字体: 时间:2025年06月27日 来源:Computer Vision and Image Understanding 4.3

编辑推荐:

  针对医学图像分割中CNN长程依赖不足和Transformer计算复杂度高的问题,研究人员提出UM-Mamba网络,通过2D螺旋选择性扫描(SSS2D)模块和医学视觉状态空间(MVSS)块重构U型架构,在Kvasir-SEG和ISIC2018数据集上实现Dice/IoU/MAE指标最优,为医学图像分析提供高效新范式。

  

医学图像分割是辅助疾病诊断和治疗规划的关键技术,但现有方法面临两难困境:基于卷积神经网络(CNN)的模型如U-Net虽结构简单,却因局部感受野难以捕捉长程依赖;而基于Transformer的模型虽能获取全局信息,但其自注意力机制导致计算复杂度随图像尺寸呈二次方增长。近年来,状态空间模型(State Space Models, SSMs)凭借线性计算复杂度和优异的长序列建模能力,在自然语言处理领域崭露头角,但其因果性限制阻碍了在非序列结构的2D医学图像中的应用。

为解决这一挑战,湖南自然科学研究基金支持的研究团队提出UM-Mamba网络,通过创新性设计2D螺旋选择性扫描(Spiral Selective Scanning for 2D, SSS2D)模块,将医学图像特征提取能力提升至新高度。该成果发表于《Computer Vision and Image Understanding》,核心突破在于开发了专为医学图像优化的视觉状态空间块(Medical Visual State Space, MVSS),通过四条螺旋路径扫描实现全局特征捕获,同时保持线性计算复杂度。

关键技术方法包括:1)设计SSS2D模块,通过四向螺旋扫描解决2D图像非序列化问题;2)构建MVSS块替代传统卷积块;3)在Kvasir-SEG(结直肠息肉)和ISIC2018(皮肤病变)数据集验证性能,采用Dice系数、交并比(IoU)和平均绝对误差(MAE)作为评价指标。

研究结果

  1. 网络架构设计:UM-Mamba采用U型结构,编码器-解码器均由MVSS块构成,其中SSS2D模块通过顺时针/逆时针双螺旋路径扫描,使每个图像块仅获取相关路径信息,显著降低计算负载。
  2. 性能对比:在Kvasir-SEG数据集上,UM-Mamba的Dice系数达0.918,较SwinUNETR提升2.3%;ISIC2018数据集IoU提高1.8%,证明其跨病种适用性。
  3. 计算效率:SSS2D将传统自注意力机制的O(n2)复杂度降至O(n),推理速度较TransUNet快1.7倍。

结论与意义
该研究首次将状态空间模型成功适配医学图像特性,SSS2D模块的创新扫描机制突破传统SSM的因果性限制。实验证实UM-Mamba在保持U-Net简洁架构优势的同时,兼具Transformer的全局建模能力和CNN的计算效率,为实时医学图像分析提供新思路。未来可扩展至三维医学影像分割,推动智能辅助诊断系统发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号