基于特征融合与动量缓冲的增强型多模态行人轨迹预测方法

【字体: 时间:2025年06月03日 来源:Expert Systems with Applications 7.5

编辑推荐:

  为解决自动驾驶中行人轨迹预测的不确定性和多模态问题,哈尔滨工业大学团队提出FFMB模型,通过向量坐标构建、多模态特征融合(MFF)和动量缓冲递归预测(MBRP)模块,显著提升预测精度。实验在ETH/UCY等五大数据集验证显示,该模型在ADE和FDE指标上优于现有方法,为智能城市交通系统提供新解决方案。

  

在智能城市和自动驾驶领域,准确预测行人轨迹是保障交通安全的核心挑战。人类行为的复杂性和不确定性使得传统方法难以应对——即使历史轨迹相同,未来路径也可能因突发转向或环境干扰而分叉。现有研究虽采用生成对抗网络(GAN)和变分自编码器(VAE)处理多模态预测,但面临训练不稳定或轨迹质量低的问题。更棘手的是,采样数据丢失关键帧信息、运动突变难以捕捉、轨迹平滑性不足三大缺陷,严重制约预测性能。

针对这些瓶颈,哈尔滨工业大学的研究团队在《Expert Systems with Applications》发表创新成果,提出FFMB模型。该工作通过三大技术突破实现:1)构建极坐标向量系统(L-Θ),解耦运动参数并增强特征表达;2)设计多模态特征融合模块(MFF),整合时间帧特征与关键点特征;3)引入动量缓冲递归预测(MBRP),通过概率修正跳出局部最优。研究采用ETH、UCY等五大行人轨迹数据集,以ADE(平均位移误差)和FDE(终点位移误差)为评估指标。

方法学亮点
团队首先开发自回放向量编码器(ARVE),将轨迹转换为极坐标向量,计算自回放距离(ARD)捕捉节点间时空关联。BelieveSparse自注意力模块优化序列依赖对齐,而MBRP模块通过动量缓冲机制从多模态预测分布中选择最优路径。实验对比了全帧数据与采样数据对模型性能的影响。

关键结论

  1. 极坐标系统的解耦优势:如图2(a)所示,传统xy坐标需协同非线性变化预测转向,而极坐标通过独立调整Θ(角度)和L(径向距离)实现精准突变捕捉。
  2. 全帧数据的增益效应:使用完整帧数据训练的模型能识别细微轨迹波动(图2(c)),而12帧采样数据导致轨迹偏差达1.2米(图1(a))。
  3. 动量缓冲的纠偏能力:MBRP模块使模型在ETH数据集上的FDE降低23.7%,有效缓解短视预测问题(图1(b))。

讨论与意义
该研究首次将物理学的动量缓冲概念引入轨迹预测,结合多模态特征融合,在保持预测平滑性(图2(b))的同时提升突变响应能力。相比Social-GAN等基线模型,FFMB在斯坦福无人机数据集(SDD)上ADE降低19.4%,证实其处理复杂城市场景的优越性。未来可扩展至车辆轨迹预测领域,为V2X(车路协同)系统提供关键技术支撑。

(注:所有数据与图表描述均源自原文,技术术语如ADE=Average Displacement Error,FDE=Final Displacement Error)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号