
-
生物通官微
陪你抓住生命科技
跳动的脉搏
UM-Mamba:基于螺旋选择性扫描的医学视觉状态空间模型在医学图像分割中的高效应用
【字体: 大 中 小 】 时间:2025年06月27日 来源:Computer Vision and Image Understanding 4.3
编辑推荐:
针对医学图像分割中CNN长程依赖不足和Transformer计算复杂度高的问题,研究人员提出UM-Mamba网络,通过2D螺旋选择性扫描(SSS2D)模块和医学视觉状态空间(MVSS)块重构U型架构,在Kvasir-SEG和ISIC2018数据集上实现Dice/IoU/MAE指标最优,为医学图像分析提供高效新范式。
医学图像分割是辅助疾病诊断和治疗规划的关键技术,但现有方法面临两难困境:基于卷积神经网络(CNN)的模型如U-Net虽结构简单,却因局部感受野难以捕捉长程依赖;而基于Transformer的模型虽能获取全局信息,但其自注意力机制导致计算复杂度随图像尺寸呈二次方增长。近年来,状态空间模型(State Space Models, SSMs)凭借线性计算复杂度和优异的长序列建模能力,在自然语言处理领域崭露头角,但其因果性限制阻碍了在非序列结构的2D医学图像中的应用。
为解决这一挑战,湖南自然科学研究基金支持的研究团队提出UM-Mamba网络,通过创新性设计2D螺旋选择性扫描(Spiral Selective Scanning for 2D, SSS2D)模块,将医学图像特征提取能力提升至新高度。该成果发表于《Computer Vision and Image Understanding》,核心突破在于开发了专为医学图像优化的视觉状态空间块(Medical Visual State Space, MVSS),通过四条螺旋路径扫描实现全局特征捕获,同时保持线性计算复杂度。
关键技术方法包括:1)设计SSS2D模块,通过四向螺旋扫描解决2D图像非序列化问题;2)构建MVSS块替代传统卷积块;3)在Kvasir-SEG(结直肠息肉)和ISIC2018(皮肤病变)数据集验证性能,采用Dice系数、交并比(IoU)和平均绝对误差(MAE)作为评价指标。
研究结果
结论与意义
该研究首次将状态空间模型成功适配医学图像特性,SSS2D模块的创新扫描机制突破传统SSM的因果性限制。实验证实UM-Mamba在保持U-Net简洁架构优势的同时,兼具Transformer的全局建模能力和CNN的计算效率,为实时医学图像分析提供新思路。未来可扩展至三维医学影像分割,推动智能辅助诊断系统发展。
生物通微信公众号
知名企业招聘