基于解耦表示学习(DisJRNet)的跌倒识别优化模型及其在视频监控中的应用研究

【字体: 时间:2025年09月23日 来源:Neurocomputing 6.5

编辑推荐:

  本文提出一种创新的解耦表示网络(DisJRNet),通过特征级人像-背景分离技术优化跌倒事件识别。该模型无需预提取人体ROI区域,直接对原始视频帧进行端到端训练,在Le2i FDD和URFD数据集上实现SOTA性能,显著提升复杂环境下的泛化能力与实时推理效率(3D CNN)。

  

Highlight

基于视觉的跌倒检测

跌倒识别在计算机视觉领域已被广泛研究。最常用且直观的方法是显式排除无关信息并分析人体区域。这些方法包括使用基于运动的背景减除技术(motion-based background subtraction)或RGB-D相机(如微软Kinect)来获取形态特征(例如宽高比和躯干角度)。然而,大多数跌倒视频数据集是在有限环境中通过模拟收集的。

Method

本节介绍我们新颖的3D CNN架构——DisJRNet,并详细解释其基本组件DisJR块的结构。DisJRNet的整体架构如图1所示。

Experiments

我们在两个公共跌倒视频基准数据集(Le2i FDD和URFD)上评估DisJRNet。4.1节讨论为获取最优设计选择而进行的消融研究,4.2节和4.3节分别展示DisJR在Le2i FDD和URFD上的有效性。随后通过特征可视化技术研究DisJR的效果(4.4节)。我们还证明DisJR对空间平移具有更强不变性,并减少时间过渡边界附近的性能下降(4.5节)。

Conclusion

我们提出DisJR-Net——一种新型3D CNN架构,可将特征解耦为两个独立成分:“人体”与“背景”。我们仅将人体和背景组合视为构成元素,并通过基于神经网络的DisJR块增强特征表示。DisJR使两种成分通过神经网络表征,并在重新组合前学习变得互异以实现特征增强。DisJR有效分离人体与背景成分,同时通过重组过程增强特征表示,最终提升跌倒识别性能。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号