基于解耦表示学习（DisJRNet）的跌倒识别优化模型及其在视频监控中的应用研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年09月23日 来源：Neurocomputing 6.5

编辑推荐：

　　本文提出一种创新的解耦表示网络（DisJRNet），通过特征级人像-背景分离技术优化跌倒事件识别。该模型无需预提取人体ROI区域，直接对原始视频帧进行端到端训练，在Le2i FDD和URFD数据集上实现SOTA性能，显著提升复杂环境下的泛化能力与实时推理效率（3D CNN）。

Highlight

基于视觉的跌倒检测

跌倒识别在计算机视觉领域已被广泛研究。最常用且直观的方法是显式排除无关信息并分析人体区域。这些方法包括使用基于运动的背景减除技术（motion-based background subtraction）或RGB-D相机（如微软Kinect）来获取形态特征（例如宽高比和躯干角度）。然而，大多数跌倒视频数据集是在有限环境中通过模拟收集的。

Method

本节介绍我们新颖的3D CNN架构——DisJRNet，并详细解释其基本组件DisJR块的结构。DisJRNet的整体架构如图1所示。

Experiments

我们在两个公共跌倒视频基准数据集（Le2i FDD和URFD）上评估DisJRNet。4.1节讨论为获取最优设计选择而进行的消融研究，4.2节和4.3节分别展示DisJR在Le2i FDD和URFD上的有效性。随后通过特征可视化技术研究DisJR的效果（4.4节）。我们还证明DisJR对空间平移具有更强不变性，并减少时间过渡边界附近的性能下降（4.5节）。

Conclusion

我们提出DisJR-Net——一种新型3D CNN架构，可将特征解耦为两个独立成分：“人体”与“背景”。我们仅将人体和背景组合视为构成元素，并通过基于神经网络的DisJR块增强特征表示。DisJR使两种成分通过神经网络表征，并在重新组合前学习变得互异以实现特征增强。DisJR有效分离人体与背景成分，同时通过重组过程增强特征表示，最终提升跌倒识别性能。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号