
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于特征融合与动量缓冲的增强型多模态行人轨迹预测方法
【字体: 大 中 小 】 时间:2025年06月03日 来源:Expert Systems with Applications 7.5
编辑推荐:
为解决自动驾驶中行人轨迹预测的不确定性和多模态问题,哈尔滨工业大学团队提出FFMB模型,通过向量坐标构建、多模态特征融合(MFF)和动量缓冲递归预测(MBRP)模块,显著提升预测精度。实验在ETH/UCY等五大数据集验证显示,该模型在ADE和FDE指标上优于现有方法,为智能城市交通系统提供新解决方案。
在智能城市和自动驾驶领域,准确预测行人轨迹是保障交通安全的核心挑战。人类行为的复杂性和不确定性使得传统方法难以应对——即使历史轨迹相同,未来路径也可能因突发转向或环境干扰而分叉。现有研究虽采用生成对抗网络(GAN)和变分自编码器(VAE)处理多模态预测,但面临训练不稳定或轨迹质量低的问题。更棘手的是,采样数据丢失关键帧信息、运动突变难以捕捉、轨迹平滑性不足三大缺陷,严重制约预测性能。
针对这些瓶颈,哈尔滨工业大学的研究团队在《Expert Systems with Applications》发表创新成果,提出FFMB模型。该工作通过三大技术突破实现:1)构建极坐标向量系统(L-Θ),解耦运动参数并增强特征表达;2)设计多模态特征融合模块(MFF),整合时间帧特征与关键点特征;3)引入动量缓冲递归预测(MBRP),通过概率修正跳出局部最优。研究采用ETH、UCY等五大行人轨迹数据集,以ADE(平均位移误差)和FDE(终点位移误差)为评估指标。
方法学亮点
团队首先开发自回放向量编码器(ARVE),将轨迹转换为极坐标向量,计算自回放距离(ARD)捕捉节点间时空关联。BelieveSparse自注意力模块优化序列依赖对齐,而MBRP模块通过动量缓冲机制从多模态预测分布中选择最优路径。实验对比了全帧数据与采样数据对模型性能的影响。
关键结论
讨论与意义
该研究首次将物理学的动量缓冲概念引入轨迹预测,结合多模态特征融合,在保持预测平滑性(图2(b))的同时提升突变响应能力。相比Social-GAN等基线模型,FFMB在斯坦福无人机数据集(SDD)上ADE降低19.4%,证实其处理复杂城市场景的优越性。未来可扩展至车辆轨迹预测领域,为V2X(车路协同)系统提供关键技术支撑。
(注:所有数据与图表描述均源自原文,技术术语如ADE=Average Displacement Error,FDE=Final Displacement Error)
生物通微信公众号
知名企业招聘