
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于解耦表示学习(DisJRNet)的跌倒识别优化模型及其在视频监控中的应用研究
【字体: 大 中 小 】 时间:2025年09月23日 来源:Neurocomputing 6.5
编辑推荐:
本文提出一种创新的解耦表示网络(DisJRNet),通过特征级人像-背景分离技术优化跌倒事件识别。该模型无需预提取人体ROI区域,直接对原始视频帧进行端到端训练,在Le2i FDD和URFD数据集上实现SOTA性能,显著提升复杂环境下的泛化能力与实时推理效率(3D CNN)。
Highlight
基于视觉的跌倒检测
跌倒识别在计算机视觉领域已被广泛研究。最常用且直观的方法是显式排除无关信息并分析人体区域。这些方法包括使用基于运动的背景减除技术(motion-based background subtraction)或RGB-D相机(如微软Kinect)来获取形态特征(例如宽高比和躯干角度)。然而,大多数跌倒视频数据集是在有限环境中通过模拟收集的。
Method
本节介绍我们新颖的3D CNN架构——DisJRNet,并详细解释其基本组件DisJR块的结构。DisJRNet的整体架构如图1所示。
Experiments
我们在两个公共跌倒视频基准数据集(Le2i FDD和URFD)上评估DisJRNet。4.1节讨论为获取最优设计选择而进行的消融研究,4.2节和4.3节分别展示DisJR在Le2i FDD和URFD上的有效性。随后通过特征可视化技术研究DisJR的效果(4.4节)。我们还证明DisJR对空间平移具有更强不变性,并减少时间过渡边界附近的性能下降(4.5节)。
Conclusion
我们提出DisJR-Net——一种新型3D CNN架构,可将特征解耦为两个独立成分:“人体”与“背景”。我们仅将人体和背景组合视为构成元素,并通过基于神经网络的DisJR块增强特征表示。DisJR使两种成分通过神经网络表征,并在重新组合前学习变得互异以实现特征增强。DisJR有效分离人体与背景成分,同时通过重组过程增强特征表示,最终提升跌倒识别性能。
生物通微信公众号
知名企业招聘