
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Mamba增强与多尺度空间注意力的遥感目标检测网络ME-MSA-YOLO
【字体: 大 中 小 】 时间:2025年07月22日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
研究人员针对遥感图像中小目标检测存在的全局-局部特征整合不足、语义与位置信息融合不充分等问题,提出ME-MSA-YOLO模型。通过SPPF-Mamba模块融合全局-局部特征,结合新型多尺度自适应空间注意力(MASA)构建ES-HS-FPN网络,显著提升复杂背景下小目标检测精度。实验表明该模型在多个遥感数据集上优于现有SOTA方法,为环境监测、军事侦察等领域提供技术支撑。
遥感图像中的目标检测技术是环境监测、城市规划和军事侦察的重要工具,但现实场景中的小目标往往淹没在复杂的背景噪声中,犹如"大海捞针"。现有算法如Faster-RCNN、YOLOv8等虽在自然图像中表现优异,却难以应对遥感图像特有的挑战:目标尺寸微小、尺度变化剧烈、背景干扰复杂。更棘手的是,当前方法往往顾此失彼——要么像RFEB模块只关注局部特征,要么如GIEM模块偏重全局信息,缺乏对两者协同作用的深入挖掘。这种"盲人摸象"式的特征提取方式,导致小目标与背景的关联性表达不充分,检测精度遭遇瓶颈。
河北创新驱动发展研究中心的研究团队在《Engineering Applications of Artificial Intelligence》发表的研究中,提出了突破性的ME-MSA-YOLO解决方案。该研究通过两项核心技术革新:首先开发的SPPF-Mamba模块采用双分支架构,结合Mamba模块的全局建模能力与卷积-池化操作的局部特征提取优势;其次设计的MASA注意力机制融入特征金字塔网络ES-HS-FPN,实现语义信息与位置坐标的精准对齐。实验证明该方法在DOTA等遥感数据集上mAP指标显著提升,为高精度遥感解译树立了新标杆。
关键技术包括:1)基于状态空间模型(SSM)的Mamba模块构建全局特征提取分支;2)多尺度自适应空间注意力(MASA)机制设计;3)改进的高层筛选特征金字塔网络(ES-HS-FPN)架构;4)在DOTA、DIOR等标准数据集上的对比验证实验。
【Related works】
研究梳理了多尺度特征融合、注意力机制和视觉任务中状态空间模型的应用现状,指出现有方法在全局-局部特征交互方面的不足,为后续创新提供理论基础。
【Proposed method】
核心创新点SPPF-Mamba模块通过并行分支处理特征:Mamba分支利用状态空间方程建模长程依赖,卷积分支通过不同核尺寸池化捕获局部细节。ES-HS-FPN网络引入的空间-通道双维度注意力机制,可动态抑制背景噪声并增强目标区域响应,实验显示其对10×10像素目标的检测召回率提升23.6%。
【Experiments】
在DIOR数据集上的对比实验表明,ME-MSA-YOLO的mAP50达到68.9%,超越DINO、RT-DETR等SOTA模型4.2个百分点。消融实验验证MASA模块使小目标检测F1-score提升17.8%,证实其多尺度自适应能力的有效性。
【Conclusion】
该研究通过SPPF-Mamba与ES-HS-FPN的协同设计,首次实现遥感目标检测中全局上下文与局部特征的有机统一。MASA模块的创新性在于将空间注意力扩展为多尺度可调节机制,为复杂场景下的小目标检测提供新思路。值得注意的是,该方法在保持YOLO系列实时性的同时,将小目标漏检率降低至传统方法的1/3,这对灾害监测等时效性敏感场景具有重要应用价值。未来研究可探索该框架在视频遥感流数据处理中的扩展应用。
生物通微信公众号
知名企业招聘