Spike-TBR:一种基于脉冲神经网络的抗噪事件表征方法及其在视觉应用中的性能提升

【字体: 时间:2025年06月25日 来源:Pattern Recognition Letters 3.9

编辑推荐:

  本研究针对事件相机数据流处理中的噪声敏感性问题,提出了一种新型编码策略Spike-TBR,通过整合脉冲神经网络(SNN)与时间二元表征(TBR),显著提升了事件流表示的鲁棒性。实验表明,该方法在多个数据集上优于传统TBR,尤其在噪声环境下性能提升显著,为事件驱动视觉任务提供了更可靠的解决方案。

  

论文解读
传统RGB相机在高速运动场景中易出现运动模糊和动态范围受限等问题,而事件相机通过异步事件捕捉机制解决了这些痛点。然而,如何将异步事件流高效转换为适合计算机视觉处理的格式,尤其是在噪声干扰下保持稳定性,成为亟待解决的挑战。现有方法如时间二元表征(TBR)虽能实现紧凑的帧式表达,但对噪声极度敏感——单个噪声事件可能导致最高有效位翻转,进而使整个表征失效。

为此,研究人员提出Spike-TBR,这是一种融合脉冲神经网络(SNN)生物学特性与TBR框架优势的混合编码策略。该创新方法利用SNN的膜电位累积机制过滤噪声事件,仅当电位超过阈值时才触发脉冲,这些脉冲被同步采样为二进制帧并最终转换为抗噪的TBR表征。通过四种SNN变体(LIF、RecLIF、LRLIF和PLIF)的系统性实验,研究团队在DVSGesture-128、DVSLip等数据集上验证了其性能:在无噪声条件下与TBR相当(DVSGesture-128达99.62%准确率),而在噪声环境中优势显著(如DVSLip在0.01噪声水平下仍保持27.07%准确率,远超TBR的6.57%)。

关键技术包括:1)基于LIF(Leaky Integrate-and-Fire)神经元的脉冲触发机制;2)递归突触(RecLIF)增强时序信息保留;3)参数化LIF(PLIF)实现可学习膜时间常数;4)采用I3D卷积网络处理生成的Spike-TBR帧序列。

研究结果

  1. 噪声过滤可视化验证:实验显示SNN层能有效抑制随机噪声,在1%噪声水平下仍能保留真实事件特征(图3)。
  2. 跨数据集性能比较:在DVSLip任务中,Spike-TBRLIF以75.91%准确率刷新纪录,较传统TBR提升5.91%(表2)。
  3. 噪声鲁棒性测试:当注入5%噪声时,Spike-TBRPLIF在DVSGesture-128保持84.47%准确率,而TBR骤降至9.09%(表6)。
  4. 参数敏感性分析:膜电位衰减系数β对性能影响显著,高事件率数据集(如DVSGesture-128)宜用低β值(0.3),而稀疏事件数据(如DVSLip)需高β值(0.9)以延长信号记忆(表7)。

结论与意义
该研究开创性地将SNN的生物学特性与帧式处理范式相结合,解决了事件表征领域的关键瓶颈问题。其重要意义体现在:1)首次证明SNN层可作为通用噪声过滤器,即使训练数据纯净也能抵抗未知噪声;2)提出的PLIF变体通过可学习参数实现自适应时序动态调整;3)计算开销分析显示AC操作仅增加0.02%,验证了方案的工程可行性。这项工作为开发新一代抗噪事件视觉系统奠定了理论基础,特别适用于自动驾驶、机器人感知等对噪声敏感的关键场景。未来研究可探索该框架在光流估计、目标跟踪等任务中的扩展应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号