
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于动态损失调整与多尺度特征融合的MFF-YOLO模型在SAR图像船舶检测中的性能提升研究
【字体: 大 中 小 】 时间:2025年08月01日 来源:Discover Imaging
编辑推荐:
本研究针对合成孔径雷达(SAR)图像中船舶检测面临的背景干扰、目标尺度多变等挑战,创新性地提出MFF-YOLO模型。通过集成多尺度双注意力(MDSA)模块、频率感知特征融合(FAFF)模块和Wise IoU v3(WIoU v3)损失函数,在SSDD和LS-SSDD数据集上分别实现mAP0.5提升3.55%和5.73%,为复杂海况下的实时海事监控提供了更鲁棒的解决方案。
在浩瀚的海洋监测领域,合成孔径雷达(SAR)如同永不疲倦的"天眼",能够穿透云雾实现全天候成像。然而这颗"天眼"捕获的图像却充满挑战:船舶目标可能小如芝麻,背景海面却波涛汹涌,更别提雷达特有的"椒盐噪声"干扰。传统检测方法就像用渔网捞小鱼,要么漏掉目标,要么误捞海浪。即便是当前主流的YOLO系列算法,面对SAR图像中<5%的小目标占比和高达30dB的噪声干扰时,检测精度仍会骤降15%以上。
西安理工大学自动化与信息工程学院的研究团队敏锐地发现了这一技术痛点。他们通过分析发现,现有模型存在三个致命缺陷:多尺度特征融合时"顾大失小",高频特征提取时"水土不服",以及损失函数对所有样本"一视同仁"。为此,该团队在YOLOv8n框架上动了一场"精准外科手术",相关成果发表在《Discover Imaging》上。
研究团队采用三项核心技术:首先开发多尺度双注意力(MDSA)模块,通过并联通道注意力(ConvSE)和多尺度空间注意力(MSA)实现特征双重校准;其次设计频率感知特征融合(FAFF)模块,采用快速傅里叶变换(FFT)提取频域特征并设计自适应软掩膜;最后引入WIoU v3动态损失函数,通过非单调聚焦机制调整梯度权重。实验采用SSDD和LS-SSDD两个典型数据集,包含1160张含2456个标注目标的SAR图像,所有图像统一缩放至640×640分辨率。
Multi-Scale dual attention
MDSA模块的创新性体现在"分而治之"的设计哲学:通道注意力分支通过压缩-激励操作生成通道权重,空间注意力分支则采用3×3/5×5/7×7多尺度卷积并行提取空间特征。定量实验显示,单独使用MDSA可使mAP0.5提升1.28%,其热力图显示对船舶桅杆等关键结构的关注度提升40%。
Frequency-aware feature fusion
FAFF模块的巧妙之处在于构建"空间-频域"双通道信息流。通过2D-FFT转换后的幅度谱计算自适应权重,配合逆变换实现特征重构。图6直观展示该模块能使船舶轮廓信噪比(SNR)提升3dB,在LS-SSDD数据集上使小目标召回率提高2.94%。
Loss function
WIoU v3通过动态梯度缩放因子r=β/δαβ-δ实现智能优化,其中β=LIoU*/LIoU反映锚框质量。对比实验表明,该损失函数使低质量预测框的影响降低37%,在复杂背景下mAP0.5:0.95提升达5.32%。
研究结论部分指出,MFF-YOLO在SSDD数据集上达到97.11%的精确度和98.33%的mAP0.5,其12.6 GFLOPs的计算复杂度显著低于传统检测框架。特别值得注意的是,FAFF与MDSA的协同效应使特征图高频分量信噪比提升2.3倍,而WIoU v3的引入使模型对中等质量锚框的回归精度提高19%。这些突破为SAR图像实时处理提供了新的技术路径,在海上搜救、非法捕捞监测等领域具有重要应用价值。讨论部分同时指出,当前方法在极端杂乱背景下的误检率仍达8.7%,未来需结合物理散射模型进一步优化特征表示。
生物通微信公众号
知名企业招聘