基于特征融合与动量缓冲的增强型多模态行人轨迹预测方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月03日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　为解决自动驾驶中行人轨迹预测的不确定性和多模态问题，哈尔滨工业大学团队提出FFMB模型，通过向量坐标构建、多模态特征融合（MFF）和动量缓冲递归预测（MBRP）模块，显著提升预测精度。实验在ETH/UCY等五大数据集验证显示，该模型在ADE和FDE指标上优于现有方法，为智能城市交通系统提供新解决方案。

在智能城市和自动驾驶领域，准确预测行人轨迹是保障交通安全的核心挑战。人类行为的复杂性和不确定性使得传统方法难以应对——即使历史轨迹相同，未来路径也可能因突发转向或环境干扰而分叉。现有研究虽采用生成对抗网络（GAN）和变分自编码器（VAE）处理多模态预测，但面临训练不稳定或轨迹质量低的问题。更棘手的是，采样数据丢失关键帧信息、运动突变难以捕捉、轨迹平滑性不足三大缺陷，严重制约预测性能。

针对这些瓶颈，哈尔滨工业大学的研究团队在《Expert Systems with Applications》发表创新成果，提出FFMB模型。该工作通过三大技术突破实现：1）构建极坐标向量系统（L-Θ），解耦运动参数并增强特征表达；2）设计多模态特征融合模块（MFF），整合时间帧特征与关键点特征；3）引入动量缓冲递归预测（MBRP），通过概率修正跳出局部最优。研究采用ETH、UCY等五大行人轨迹数据集，以ADE（平均位移误差）和FDE（终点位移误差）为评估指标。

方法学亮点
团队首先开发自回放向量编码器（ARVE），将轨迹转换为极坐标向量，计算自回放距离（ARD）捕捉节点间时空关联。BelieveSparse自注意力模块优化序列依赖对齐，而MBRP模块通过动量缓冲机制从多模态预测分布中选择最优路径。实验对比了全帧数据与采样数据对模型性能的影响。

关键结论

极坐标系统的解耦优势：如图2(a)所示，传统xy坐标需协同非线性变化预测转向，而极坐标通过独立调整Θ（角度）和L（径向距离）实现精准突变捕捉。
全帧数据的增益效应：使用完整帧数据训练的模型能识别细微轨迹波动（图2(c)），而12帧采样数据导致轨迹偏差达1.2米（图1(a)）。
动量缓冲的纠偏能力：MBRP模块使模型在ETH数据集上的FDE降低23.7%，有效缓解短视预测问题（图1(b)）。

讨论与意义
该研究首次将物理学的动量缓冲概念引入轨迹预测，结合多模态特征融合，在保持预测平滑性（图2(b)）的同时提升突变响应能力。相比Social-GAN等基线模型，FFMB在斯坦福无人机数据集（SDD）上ADE降低19.4%，证实其处理复杂城市场景的优越性。未来可扩展至车辆轨迹预测领域，为V2X（车路协同）系统提供关键技术支撑。

（注：所有数据与图表描述均源自原文，技术术语如ADE=Average Displacement Error，FDE=Final Displacement Error）

热点排行

新闻专题

联系信箱：

粤ICP备09063491号