
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于渐进式增强多级特征融合的遥感小目标检测网络(PEMFF)创新研究
【字体: 大 中 小 】 时间:2025年06月25日 来源:Neurocomputing 5.5
编辑推荐:
【编辑推荐】针对遥感影像小目标检测存在的低分辨率、背景干扰等难题,深圳大学团队提出渐进式增强多级特征融合网络(PEMFF),通过RepMF模块实现跨层动态特征聚合,RMA模块强化空间-通道注意力机制,RepIJ模块注入高层语义,在AI-TOD数据集上AP50达58.4%,较YOLOv8提升12.2%,为复杂场景小目标识别提供新范式。
遥感影像中的小目标检测一直是计算机视觉领域的重大挑战。由于卫星拍摄视角的特殊性,这类图像中的目标往往仅占几个像素,却要面对复杂背景、高密度分布等干扰。就像在千米高空辨认地面的火柴盒,传统方法常因特征信息不足而失效。现有技术虽通过多尺度融合或特征增强部分缓解问题,但深层网络的语义稀释和空间细节丢失仍是瓶颈——这好比试图用模糊的望远镜寻找星空中的暗星,既需要广域视野又需极高精度。
针对这一难题,深圳大学智能信息处理研究所的研究团队在《Neurocomputing》发表研究,提出名为PEMFF的渐进式增强多级特征融合网络。该工作创新性地设计了三重机制:可学习权重分配的重新参数化多信息融合模块(RepMF)构建动态特征通路,残差多维注意力模块(RMA)通过级联空间-通道注意力抑制背景噪声,重新参数化信息注入模块(RepIJ)利用自适应核变换将高层语义注入浅层特征。实验证明,该网络在AI-TOD数据集上AP50达到58.4%,显著优于主流模型。
关键技术方法包括:基于CSPDarkNet的主干特征提取网络构建多尺度表征;RepMF通过结构重参数化实现跨层特征自适应融合;RMA采用残差连接的混合注意力机制增强特征判别力;RepIJ通过可变形卷积优化语义注入过程;快速解耦检测模块(FDD)分离分类与定位特征空间。研究使用包含28,036张航空图像的AI-TOD数据集,涵盖8类小目标。
【网络结构】
PEMFF采用三级架构:CSPDarkNet提取多尺度特征,RepMF实现深浅层特征双向交互,RMA通过空间-通道注意力残差块增强关键区域响应。其中RepMF的并行分支结构在训练后合并为单一卷积核,兼顾性能与效率。
【实验结果】
在飞机、储油罐等小目标检测中,PEMFF的AP50比YOLOv8提升12.2%,尤其对16×16像素以下目标召回率提高19.8%。可视化显示RMA有效抑制云层等背景干扰,RepIJ使浅层特征保留清晰边界。
【结论】
该研究突破性地解决了小目标检测中的三大矛盾:通过RepMF平衡语义与空间特征,RMA缓解背景干扰,RepIJ遏制语义稀释。方法在保持11.3GFLOPs计算量下实现SOTA性能,为无人机巡检、灾害监测等应用提供新工具。未来可探索跨模态特征融合进一步突破分辨率极限。
生物通微信公众号
知名企业招聘