
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于神经表征时空张量的红外小目标检测方法研究
【字体: 大 中 小 】 时间:2025年06月20日 来源:Pattern Recognition 7.5
编辑推荐:
针对红外序列图像中动态背景与稀疏目标分离难题,电子科技大学团队提出神经表征时空张量模型(NeurSTT)。该研究通过低秩引导的深度网络非线性逼近背景,开发神经三维全变分(Neur3DTV)增强时空特征关联,结合无监督学习策略,在256×256序列上实现IoU提升22.44%且参数量减少16.6倍,为复杂场景红外检测提供新范式。
在复杂气象条件下,红外成像技术凭借其全天候工作能力成为军事侦察、安防监控等领域的关键手段。然而,远距离探测导致目标呈现"三无"特征——无清晰形状、无高对比度、无稳定信噪比,传统基于单帧图像的优化方法(如RPCA)难以应对动态场景变化,而深度学习又面临标注数据匮乏和模型不可解释的困境。更棘手的是,现有时空张量算法计算复杂度高,且多数研究孤立处理目标而忽略背景的动态建模,导致虚假警报率居高不下。
电子科技大学的研究团队在《Pattern Recognition》发表的研究中,创新性地将隐式神经表示(INR)与张量分解结合,构建神经表征时空张量模型(NeurSTT)。该工作通过三个核心技术突破:1)采用低秩先验引导的深度网络替代传统线性逼近,通过核范数约束学习背景时空特征;2)设计神经三维全变分(Neur3DTV)模块,利用神经网络梯度算子实现连续域时空平滑;3)将软阈值算子融入损失函数,在无监督框架下同步优化目标稀疏性。实验显示,该方法在SIRST和ISTD-3D数据集上,相比次优方法平均IoU提升22.44%,参数量仅为其1/16.6,且在噪声环境下保持鲁棒性。
主要技术方法
研究直接堆叠连续帧构建三维时空张量D∈Rn1×n2×n3,通过Adam算法联合优化三个损失项:低秩背景网络采用U-Net结构约束核范数;Neur3DTV模块通过三维卷积提取时空梯度;目标更新引入?1范数稀疏约束。所有实验均在NVIDIA RTX 3090显卡上完成,对比基线包括TDLMS、NRAM等传统方法和ACDC、IAE等深度学习方法。
研究结果
结论与意义
该研究开创性地将神经表示理论与红外物理特性结合:1)提出的Neur3DTV突破传统离散正则化局限,通过神经网络实现连续时空约束;2)无监督框架避免对标注数据的依赖,模型在跨场景测试中保持稳定性;3)轻量化设计使算法可部署于边缘设备。局限性在于对极端快速运动目标的适应性有待提升,未来可探索脉冲神经网络处理更高时序分辨率数据。这项工作为红外智能感知提供了新方法论,其"深度优化"思路可拓展至多光谱检测等领域。
生物通微信公众号
知名企业招聘