基于图特征重建与多尺度自注意力编码的遮挡场景行人过街意图预测

【字体: 时间:2025年07月19日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  为解决城市交通中因遮挡导致行人检测困难及环境特征冗余问题,研究人员提出"Obstruction-CityWalk"模型,通过图自编码器重建遮挡特征,结合多尺度非均匀自注意力编码器抑制背景噪声,在PIE和JAAD数据集上分别实现3%和6%的准确率提升,为智能驾驶系统提供更精准的行人意图预判能力。

  

在城市交通的复杂环境中,行人作为"最脆弱道路使用者"面临着严峻的安全挑战。世界卫生组织数据显示,全球每年约30万人死于交通事故,而中国2023年行人相关事故直接经济损失高达123.92亿元。现有高级驾驶辅助系统(ADAS)如沃尔沃City Safety和奥迪Pre-Sense City在行人被部分遮挡时性能显著下降,这种"视觉盲区"导致驾驶员反应延迟,成为交通事故的重要诱因。传统预测方法如社会力模型(Social Force Model)计算复杂,基于骨骼关键点的支持向量机(SVM)方法又易受随机行为干扰,而深度学习模型在遮挡场景下常因特征缺失导致误判。

陕西省社会科学基金资助的研究团队提出创新性解决方案"Obstruction-CityWalk"模型,该成果发表于《Engineering Applications of Artificial Intelligence》。研究采用双模块架构:行人捕捉模块通过图自编码器构建头、身、足节点网络,利用可见部位特征预测被遮挡部位(如当身体被车辆遮挡时,通过头部运动推断全身姿态);意图预测模块则创新性地设计多尺度非均匀自注意力编码器,像"智能滤镜"般动态调节环境要素权重,在JAAD和PIE数据集上分别提升6%和3%的准确率。

关键技术包括:1)基于图自编码器(GAE)的特征重建技术,通过建立人体关键部位节点网络解决遮挡问题;2)抗遮挡跟踪器组件,提升复杂场景下的追踪连续性;3)多尺度非均匀自注意力机制,采用动态权重分配策略抑制交通信号灯等背景干扰;4)协同注意力(Co-Attention)特征融合方法,平衡视觉特征与环境语义的贡献度。

【场景解析】
研究首先建立"行人-环境"交互图谱,筛选出12类直接影响过街决策的要素(如车辆速度、交通灯状态),通过图卷积网络(GCN)提取空间关系特征,为后续预测提供结构化环境表征。

【数据集】
采用JAAD数据集(346段视频,82,032帧)和PIE数据集(6小时视频,2,800个过街事件)进行验证,这两个数据集涵盖多种天气、光照条件及典型城市遮挡场景,为模型训练提供真实世界多样性。

【结果】
可视化结果显示,模型将过街意图强度划分为25%间隔的四个等级,用蓝、黄、橙、红色渐变标识。在PIE数据集上达到87%的准确率,较现有最优方法提升3个百分点;抗遮挡组件使跟踪一致性提高15%,多尺度编码器贡献6%的精度增益。

【结论】
该研究突破性地解决了遮挡场景下的行人意图预测难题:1)图特征重建技术将遮挡部位的预测误差降低40%;2)动态注意力机制使环境噪声抑制效率提升35%;3)模型在复杂路口场景的泛化能力显著优于传统方法。这项成果为智能驾驶系统提供了更可靠的"预判智慧",尤其对解决"鬼探头"等突发险情具有重要应用价值。未来研究可探索多模态传感器数据融合,进一步提升极端天气下的预测鲁棒性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号