
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于切片Wasserstein加权多模态MambaVision的动态交互感知车辆轨迹预测模型研究
【字体: 大 中 小 】 时间:2025年07月28日 来源:Knowledge-Based Systems 7.2
编辑推荐:
为解决自动驾驶中车辆轨迹预测(VTP)的动态异质交互难题,研究人员提出交互感知时空动态图神经网络(IA-STDGNN),通过特征提取模块(FEM)和车道特异性交互机制,实现目标与周边车辆轨迹的多模态预测。实验表明该模型在NGSIM数据集上超越现有方法,为复杂交通场景决策提供新思路。
在自动驾驶技术快速发展的今天,车辆轨迹预测(Vehicle Trajectory Prediction, VTP)犹如交通系统的"读心术",其准确性直接关系到道路安全与通行效率。尽管当前配备感知设备的自动驾驶车辆(AVs)能获取周边车辆轨迹信息,但交通场景中车辆交互的动态性、异质性如同变幻莫测的舞蹈,使得传统预测方法常陷入"顾此失彼"的困境——要么难以捕捉长时序依赖,要么忽视空间交互的时空耦合特性。这种"时空割裂"的建模方式,导致预测结果在复杂交通场景中频频"失准"。
针对这一行业痛点,江苏大学的研究团队在《Knowledge-Based Systems》发表创新成果,提出名为IA-STDGNN的交互感知时空动态图神经网络。该研究通过五项核心技术突破:特征提取模块(FEM)挖掘运动状态特征、实例归一化处理数据分布偏移、动态图卷积网络(VI-DGCN)创新性引入单车道(SL-VI)与多车道(ML-VI)双交互机制、时空特征依赖融合模块(STFDFM)实现维度耦合、以及多模态轨迹预测输出,最终在NGSIM标准数据集上实现预测精度与效率的双重飞跃。
特征提取与趋势建模
研究团队设计的FEM模块通过轨迹残差与离散导数操作,将原始坐标转化为包含速度、加速度等高阶运动特征的张量。特别值得注意的是,创新采用的实例归一化(INM)有效缓解了不同车辆运动模式的分布差异,配合线性趋势预测模块,使模型具备"察微知著"的能力——既能捕捉车辆的惯性运动趋势,又能感知细微交互影响。
动态交互图卷积网络
VI-DGCN作为核心创新点,颠覆了传统静态图卷积的局限。其动态更新机制使边权重能实时反映车辆间交互强度的变化,而SL-VI与ML-VI双机制设计更精准刻画了车道约束下的异质交互。当两车同处单车道时,SL-VI机制会强化其交互权重;而ML-VI则专注多车道场景下的潜在影响,这种"因地制宜"的建模策略显著提升了空间关系表征能力。
时空特征融合创新
STFDFM模块采用门控融合机制破解了"时空特征割裂"难题。通过设计时空交叉注意力层,使模型能自主权衡时空特征的贡献度,实现"1+1>2"的融合效果。实验显示该模块使预测误差降低达12.7%,印证了时空协同建模的重要性。
多模态预测输出
最终的轨迹预测模块(TPM)采用混合密度网络架构,通过并行预测多条概率轨迹反映交通场景的不确定性。特别设计的线性模型输出拼接策略,既保留深度学习模型的非线性拟合优势,又融合了物理运动规律的可解释性。
这项研究的意义不仅在于技术指标的提升,更开创了自动驾驶轨迹预测的新范式。其动态交互建模思想为处理复杂交通系统提供了通用框架,而时空融合机制对智能交通领域的多源数据整合具有启示价值。值得关注的是,模型采用的Mamba架构展现出比Transformer更优的时序处理效率,这为车载计算资源受限场景提供了优选方案。未来,该成果或可延伸至车路协同系统,推动智能交通向"全息感知、精准预测"的新阶段迈进。
生物通微信公众号
知名企业招聘