基于神经表征时空张量的红外小目标检测方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月20日 来源：Pattern Recognition 7.5

编辑推荐：

　　针对红外序列图像中动态背景与稀疏目标分离难题，电子科技大学团队提出神经表征时空张量模型（NeurSTT）。该研究通过低秩引导的深度网络非线性逼近背景，开发神经三维全变分（Neur3DTV）增强时空特征关联，结合无监督学习策略，在256×256序列上实现IoU提升22.44%且参数量减少16.6倍，为复杂场景红外检测提供新范式。

在复杂气象条件下，红外成像技术凭借其全天候工作能力成为军事侦察、安防监控等领域的关键手段。然而，远距离探测导致目标呈现"三无"特征——无清晰形状、无高对比度、无稳定信噪比，传统基于单帧图像的优化方法（如RPCA）难以应对动态场景变化，而深度学习又面临标注数据匮乏和模型不可解释的困境。更棘手的是，现有时空张量算法计算复杂度高，且多数研究孤立处理目标而忽略背景的动态建模，导致虚假警报率居高不下。

电子科技大学的研究团队在《Pattern Recognition》发表的研究中，创新性地将隐式神经表示（INR）与张量分解结合，构建神经表征时空张量模型（NeurSTT）。该工作通过三个核心技术突破：1）采用低秩先验引导的深度网络替代传统线性逼近，通过核范数约束学习背景时空特征；2）设计神经三维全变分（Neur3DTV）模块，利用神经网络梯度算子实现连续域时空平滑；3）将软阈值算子融入损失函数，在无监督框架下同步优化目标稀疏性。实验显示，该方法在SIRST和ISTD-3D数据集上，相比次优方法平均IoU提升22.44%，参数量仅为其1/16.6，且在噪声环境下保持鲁棒性。

主要技术方法
研究直接堆叠连续帧构建三维时空张量D∈R^{n₁×n₂×n₃}，通过Adam算法联合优化三个损失项：低秩背景网络采用U-Net结构约束核范数；Neur3DTV模块通过三维卷积提取时空梯度；目标更新引入?₁范数稀疏约束。所有实验均在NVIDIA RTX 3090显卡上完成，对比基线包括TDLMS、NRAM等传统方法和ACDC、IAE等深度学习方法。

研究结果

背景建模有效性：低秩网络在模拟数据集中PSNR达38.6dB，较传统Tucker分解提升9.2dB，证明神经网络对复杂背景的非线性表征优势。
时空特征提取：Neur3DTV模块使动态背景残差标准差降低64%，显著抑制云层等伪目标干扰。
综合检测性能：在256×256序列测试中，该方法F-score达0.892，较最优基线提升0.147，且处理速度达17fps，满足实时性需求。

结论与意义
该研究开创性地将神经表示理论与红外物理特性结合：1）提出的Neur3DTV突破传统离散正则化局限，通过神经网络实现连续时空约束；2）无监督框架避免对标注数据的依赖，模型在跨场景测试中保持稳定性；3）轻量化设计使算法可部署于边缘设备。局限性在于对极端快速运动目标的适应性有待提升，未来可探索脉冲神经网络处理更高时序分辨率数据。这项工作为红外智能感知提供了新方法论，其"深度优化"思路可拓展至多光谱检测等领域。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号