高效曼巴模型:通过创新结构突破视觉任务中的状态空间模型局限

【字体: 时间:2025年06月13日 来源:Image and Vision Computing 4.2

编辑推荐:

  为解决状态空间模型(SSM)在视觉任务中长程依赖捕获不足、通道交互缺失和泛化能力弱的问题,研究人员提出高效曼巴模型(EMB)。该研究通过融合TransSSM模块的特征翻转与通道重排、窗口空间注意力(WSA)和双池化注意力(DPA)机制,构建MFB-SCFB复合结构,实现全局-局部特征协同建模。实验表明EMB在ImageNet分类任务中以1.4M参数达到73.5%准确率,为轻量化视觉模型设计提供新范式。

  

在人工智能领域,Transformer模型曾凭借其强大的长序列建模能力统治视觉任务多年,但高昂的计算成本让研究者们开始寻找更高效的替代方案。2023年横空出世的Mamba模型以其线性复杂度惊艳学界,然而当研究者们试图将这种专为1D序列设计的状态空间模型(State Space Model, SSM)迁移到2D图像处理时,却发现它像一条被强行拉直的蛇——原有的灵活性与效率在视觉任务中荡然无存。SSM模型在图像处理中暴露出的三大致命伤:难以捕捉像素间的长程依赖、通道间信息隔离导致的特征表达受限,以及在非序列任务中的泛化能力薄弱,成为制约其发展的桎梏。

来自中国的研究团队敏锐地意识到,单纯改进SSM扫描策略或简单嫁接Vision Transformer(ViT)无法从根本上解决问题。他们发现现有改进方案如EfficientVMamba和MambaVision仍存在计算资源消耗大、训练不稳定等缺陷,特别是在高密度信息处理任务(如图像分割)中表现欠佳。更关键的是,SSM与生俱来的"通道自闭症"(缺乏跨通道交互)严重限制了其特征表达能力,而这一特性恰恰是卷积神经网络(CNN)和Transformer成功的关键。

研究团队创造性地提出高效曼巴模型(Efficient Mamba, EMB),通过三大核心技术突破实现了SSM在视觉领域的"华丽转身"。TransSSM模块采用特征翻转和通道重排(channel shuffle)打破信息孤岛,配合双池化注意力(Dual Pooling Attention, DPA)稳定训练过程;窗口空间注意力(Window Spatial Attention, WSA)模块巧妙融合深度卷积与局部自注意力,实现像素级特征建模;而多融合块(Multi-Fusion Block, MFB)与空间通道融合块(Spatial-Channel Fusion Block, SCFB)的级联设计,则构建起全局-局部特征交互的高速通道。

关键技术方法上,研究团队在单块NVIDIA 4090 GPU上训练模型,采用最小化数据增强策略。通过整合倒残差块(Inverted Residual Blocks, IRBs)和卷积注意力模块,构建起包含TransSSM、WSA、DPA的复合结构。在ImageNet、MS COCO和ADE20K数据集上验证时,严格控制模型参数量(1.4M-5.9M)和计算量(0.3G-1.5G FLOPs)。

【TransSSM模块】通过特征翻转操作将输入特征沿高度和宽度维度分别反转,配合通道重排策略强制跨通道信息交互。实验显示该设计使ImageNet分类准确率提升2.3%,同时DPA模块通过并行最大池化与平均池化捕获通道注意力,有效缓解梯度不稳定问题。

【WSA模块】将输入特征划分为不重叠窗口,在每个窗口内执行深度卷积与多头自注意力。在ADE20K语义分割任务中,该模块使mIoU指标提升4.1%,证明其局部特征建模优势。

【MFB-SCFB结构】在高层特征阶段,SCFB通过空间分离卷积与通道重组操作,在COCO目标检测任务中实现APbox
指标3.2%的提升,验证了全局-局部特征融合的有效性。

研究结论表明,EMB模型在ImageNet分类任务中,EMB-S/T/N分别以5.9M/1.5G、2.5M/0.6G和1.4M/0.3G的参数量/计算量,取得78.9%、76.3%和73.5%的Top-1准确率,显著优于同类轻量化模型。该研究的重要意义在于:首次系统解决了SSM在视觉领域的三大核心缺陷;提出的MFB-SCFB架构为异构模型融合提供新思路;实验证明无需复杂数据增强和位置编码即可实现优异性能。论文发表于《Image and Vision Computing》,为后续SSM研究树立了新标杆。讨论部分指出,当前EMB在高层视觉任务中参数效率仍有提升空间,未来将重点优化SSM内部结构及其与注意力机制的深度耦合方式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号