综述:公共交通系统中车载动作识别模型综述

【字体: 时间:2025年05月28日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本文聚焦自动驾驶交通系统车内监控,综述车载动作识别(OBHAR)的挑战与进展。涵盖专用数据集、传统计算机视觉、深度学习及多模态方法,分析环境变化、多传感器融合等难点,为提升自动驾驶安全性提供技术参考。

  

自动驾驶交通系统车内监控与车载动作识别研究进展


一、研究背景与核心挑战


自动驾驶交通系统(如公交、地铁、火车、汽车)的普及带来便捷性提升,但乘客安全保障始终是核心议题。车内监控作为保障安全的关键环节,依赖高效的车载动作识别系统(On-Board Human Action Recognition, OBHAR)。与传统人体动作识别(Human Action Recognition, HAR)不同,OBHAR 面临独特挑战:

  1. 环境变异性:车内光照随区域(如车门附近亮度较高)和车辆移动产生动态变化,窗外光线引入背景滚动和局部明暗差异,车辆振动可能导致摄像头抖动,运行噪声(加速、刹车、开关门)影响多模态数据融合。
  2. 多传感器数据整合:拥挤场景下视频信息可能受限,需融合红外、音频等多模态数据,但跨传感器数据预处理与融合技术存在难点。
  3. 遮挡鲁棒性:公共交通(如地铁、公交)内人员密集,目标遮挡频繁,物体遮挡传感器可能降低识别精度。
  4. 实时处理需求:车载设备计算能力有限,深度学习模型需通过剪枝、量化等技术压缩规模,平衡模型大小与精度。
  5. 标注数据稀缺:隐私问题限制车内动作标注数据采集,不同交通工具的动作差异导致模型泛化性不足。

二、自动驾驶分级与车内监控需求


国际汽车工程师学会(SAE International)将道路车辆自动化分为 6 级(SAE 0-SAE 5),欧洲已实现 SAE 3 级,正推进 SAE 4 级研发(车辆可自主决策复杂场景)。轨道交通自动化分为 5 级(GoA 0-GoA 4),欧洲部分地铁已运行于 GoA 4 级,法、德、瑞士等国铁路计划 2024 年测试或部署更高自动化列车。
在最高自动化等级中,车内无工作人员,监控需求涵盖乘客计数、空座检测、 vandalism/assault 识别、物品盗窃监测及乘客健康状态(如突发疾病)。典型车载动作包括上下车、车窗涂写、跌倒、暴力行为等,其中上下车和车窗涂写为交通场景特有动作。

三、车载动作识别研究现状与数据集


尽管传统 HAR 研究热度在 2016 年达峰后有所下降,但交通场景 HAR 研究持续升温,尤其在汽车、火车、公交领域。现有综述多聚焦交通视频监控中的异常行为(如跌倒、车外暴力),缺乏对车内动作识别的系统性分析。
核心数据集

  • 覆盖公交、地铁、火车、汽车等场景,包含光照变化、拥挤度、动态背景等多样化条件。
  • 数据类型包括单目 / 双目视频、红外图像、惯性传感器数据等,部分数据集涉及多模态融合。
  • 但公开可用数据集较少,隐私问题限制大规模标注数据共享,制约模型训练与跨场景泛化。

四、技术方法与性能分析


(一)传统计算机视觉方法

早期研究依赖手工特征提取,如方向梯度直方图(HOG)、光流法,结合支持向量机(SVM)等分类器。此类方法在简单场景(如低拥挤度车内)表现尚可,但对复杂光照和遮挡鲁棒性不足。

(二)深度学习方法

  1. 卷积神经网络(CNN):利用时空特征提取,如 3D CNN 捕捉视频序列的时间维度信息,适用于单人或稀疏人群动作识别。
  2. 循环神经网络(RNN)与长短期记忆网络(LSTM):处理时序数据,捕捉动作序列的上下文依赖,常用于分析连续动作(如乘客移动路径)。
  3. Transformer 架构:近年引入自注意力机制,提升长程依赖建模能力,在多目标交互场景中表现潜力。
  4. 多模态融合模型:结合视觉(视频)、听觉(音频)、惯性传感数据,通过早期融合(数据层)或晚期融合(决策层)提升复杂场景识别精度。

(三)性能对比与局限

现有方法在受控环境(如低光照变化、少遮挡)中准确率较高,但在真实公交 / 地铁场景中,环境噪声和遮挡导致泛化性下降。此外,深度学习模型对算力需求高,嵌入式部署需轻量化优化(如模型剪枝、量化)。

五、未来研究方向与展望


  1. 隐私保护与数据共享:探索联邦学习、合成数据生成等技术,在不暴露原始数据的前提下提升模型训练效率。
  2. 轻量化模型设计:开发高效架构(如 MobileNet、EfficientNet 变体),结合神经架构搜索(NAS)优化车载部署性能。
  3. 跨场景迁移学习:利用预训练模型(如在公开 HAR 数据集上预训练)结合小样本微调,缓解特定交通场景数据不足问题。
  4. 多任务联合学习:同时实现动作识别、乘客计数、异常检测等多任务,提升系统实用性。
  5. 标准化评测体系:建立统一的数据集与评估指标,推动不同方法的公平比较与技术迭代。

六、结论


车载动作识别是自动驾驶交通系统安全的核心技术,当前研究在深度学习驱动下取得进展,但受限于数据稀缺、环境复杂性和实时性要求。未来需通过跨学科技术融合(如隐私计算、轻量化 AI)与标准化建设,推动 OBHAR 从实验室走向实际部署,为智能交通的安全运营提供关键支撑。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号