基于模仿学习与交互博弈的自动驾驶预测-决策规划框架:提升复杂城市场景下的轨迹安全性与社会合规性
【字体:
大
中
小
】
时间:2025年09月29日
来源:Neurocomputing 6.5
编辑推荐:
本文提出了一种融合模仿学习(IL)与交互博弈论的自动驾驶轨迹规划框架,通过分层多模态特征融合(Hierarchical Fusion)解决特征对齐问题,利用条件行为预测(CBP)建模车辆-障碍物交互博弈,并结合多成本优化提升开环/闭环测试性能,显著增强了复杂城市场景下的轨迹安全性、平滑度与社会合规性。
• 提出分层融合策略,在时空维度编码与融合场景级多模态特征,提升特征提取与泛化能力
• 构建条件预测与轨迹规划网络,通过车辆决策与障碍物预测轨迹的相互约束,模拟真实交互博弈行为
• 设计多成本融合函数对模仿学习结果进行后处理优化,确保导航的安全性、合法性与效率性
模仿学习中的轨迹生成网络需整合多模态场景信息,包括自车(AV)历史轨迹、他车(SV)历史运动信息、静态地图元素、车道线、交通规则等。不同模态的信息在抽象层级与尺度上存在差异(例如像素级图像特征与矢量级轨迹特征),直接堆叠可能引发特征干扰。本文采用分层融合策略,通过时空维度对齐实现多模态特征的高效整合。
本研究提出的交互预测与规划方法基于Transformer编码器-解码器架构(如图2所示)。首先,利用分层融合多模态编码器将车辆历史轨迹与场景上下文编码至高维特征空间,提取未来特征;随后,将这些特征与历史轨迹特征、场景上下文特征共同输入条件解码器,生成条件预测与规划结果。
方法在NuPlan数据集上完成训练与验证。该数据集涵盖丰富城市场景(从繁忙市中心到行人密集区域),提供多时段、多天气、多地点的详细动态标注(包括车辆、行人等实体行为),为自动驾驶系统提供了多样化挑战环境。
本文提出了一种结合分层融合与条件预测的交互预测与规划方法。分层融合策略增强了多模态特征提取与泛化能力;条件预测机制通过迭代博弈模拟提升障碍物预测与车辆规划的准确性;多成本优化函数进一步保障了轨迹的实用性与安全性。该方法在开环与闭环测试中均表现出优异性能。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号