基于神经表征时空张量的红外小目标检测方法研究

【字体: 时间:2025年06月20日 来源:Pattern Recognition 7.5

编辑推荐:

  针对红外序列图像中动态背景与稀疏目标分离难题,电子科技大学团队提出神经表征时空张量模型(NeurSTT)。该研究通过低秩引导的深度网络非线性逼近背景,开发神经三维全变分(Neur3DTV)增强时空特征关联,结合无监督学习策略,在256×256序列上实现IoU提升22.44%且参数量减少16.6倍,为复杂场景红外检测提供新范式。

  

在复杂气象条件下,红外成像技术凭借其全天候工作能力成为军事侦察、安防监控等领域的关键手段。然而,远距离探测导致目标呈现"三无"特征——无清晰形状、无高对比度、无稳定信噪比,传统基于单帧图像的优化方法(如RPCA)难以应对动态场景变化,而深度学习又面临标注数据匮乏和模型不可解释的困境。更棘手的是,现有时空张量算法计算复杂度高,且多数研究孤立处理目标而忽略背景的动态建模,导致虚假警报率居高不下。

电子科技大学的研究团队在《Pattern Recognition》发表的研究中,创新性地将隐式神经表示(INR)与张量分解结合,构建神经表征时空张量模型(NeurSTT)。该工作通过三个核心技术突破:1)采用低秩先验引导的深度网络替代传统线性逼近,通过核范数约束学习背景时空特征;2)设计神经三维全变分(Neur3DTV)模块,利用神经网络梯度算子实现连续域时空平滑;3)将软阈值算子融入损失函数,在无监督框架下同步优化目标稀疏性。实验显示,该方法在SIRST和ISTD-3D数据集上,相比次优方法平均IoU提升22.44%,参数量仅为其1/16.6,且在噪声环境下保持鲁棒性。

主要技术方法
研究直接堆叠连续帧构建三维时空张量D∈Rn1×n2×n3,通过Adam算法联合优化三个损失项:低秩背景网络采用U-Net结构约束核范数;Neur3DTV模块通过三维卷积提取时空梯度;目标更新引入?1范数稀疏约束。所有实验均在NVIDIA RTX 3090显卡上完成,对比基线包括TDLMS、NRAM等传统方法和ACDC、IAE等深度学习方法。

研究结果

  1. 背景建模有效性:低秩网络在模拟数据集中PSNR达38.6dB,较传统Tucker分解提升9.2dB,证明神经网络对复杂背景的非线性表征优势。
  2. 时空特征提取:Neur3DTV模块使动态背景残差标准差降低64%,显著抑制云层等伪目标干扰。
  3. 综合检测性能:在256×256序列测试中,该方法F-score达0.892,较最优基线提升0.147,且处理速度达17fps,满足实时性需求。

结论与意义
该研究开创性地将神经表示理论与红外物理特性结合:1)提出的Neur3DTV突破传统离散正则化局限,通过神经网络实现连续时空约束;2)无监督框架避免对标注数据的依赖,模型在跨场景测试中保持稳定性;3)轻量化设计使算法可部署于边缘设备。局限性在于对极端快速运动目标的适应性有待提升,未来可探索脉冲神经网络处理更高时序分辨率数据。这项工作为红外智能感知提供了新方法论,其"深度优化"思路可拓展至多光谱检测等领域。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号