HySA-Aug:一种混合场景自适应增强方法,用于实现多样且准确的运动预测
《TRANSPORTATION RESEARCH PART C-EMERGING TECHNOLOGIES》:HySA-Aug: Hybrid scenario-adaptive augmentation for diverse and accurate motion prediction
【字体:
大
中
小
】
时间:2026年02月21日
来源:TRANSPORTATION RESEARCH PART C-EMERGING TECHNOLOGIES 7.9
编辑推荐:
多模态轨迹预测中基于场景自适应的数据增强方法研究,提出HySA-Aug框架通过分层规则约束生成符合场景拓扑的候选轨迹,结合数据驱动行为评分模块量化评估增强轨迹的合理性,并采用多监督回归损失有效整合增强数据至预测模型,显著提升预测轨迹的多样性和准确性。
陆子恒|蔡英峰|王海|孙晓强|陈龙
江苏大学汽车工程研究院,镇江,中国
摘要
精确的运动预测对于自动驾驶系统的安全性至关重要,因为准确且多样的预测使下游规划模块能够更好地理解驾驶场景。然而,现有方法通常难以捕捉驾驶主体的多样化行为,这主要是由于依赖于存在偏见的训练数据,这些数据主要记录单一模式的轨迹,未能充分反映现实世界场景的复杂性和变异性。为了解决这个问题,我们提出了HySA-Aug,一种新颖的混合场景自适应数据增强框架,旨在丰富场景的行为分布并提高预测模型的多模态表示学习能力,从而提高预测轨迹的多样性和准确性。首先,我们从真实驾驶场景中构建了一个轨迹词汇表,并实施了一种规则约束的生成策略,通过多级约束(包括道路拓扑、与相邻代理的交互以及自身运动的一致性)来选择增强后的轨迹候选者。其次,为了进一步提高增强轨迹的质量,我们引入了一个数据驱动的轨迹评分模块,该模块通过建模真实样本和增强样本之间的特征分布差异来评估候选轨迹的真实性,有效减少了领域差距。此外,我们还提出了一种基于场景拓扑的行为划分策略,以提高评分模块的训练样本质量和多样性。最后,我们提出了一种训练策略,通过多监督回归损失将高质量的增强轨迹整合到预测过程中,使得多样化的行为模式能够高效且轻量地融入现有的预测模型中。在包括Argoverse 1、Argoverse 2和Waymo在内的多个数据集上的实验表明,所提出的增强框架在保持高预测准确性的同时提高了行为多样性。
引言
运动预测是自动驾驶系统安全运行的基础。准确预测周围代理的未来轨迹使系统能够有效理解和响应复杂环境。然而,由于人类驾驶行为的固有不确定性,实现多样且准确的预测仍然是一个重大挑战(Dong等人,2024年;Li等人,2025c年)。
主流研究已转向多模态预测框架(Gao等人,2020年;Liu等人,2021年),以解决这一问题。这些方法通过建模场景交互,使用基于锚点或查询的解码器生成一组具有高局部细节的未来轨迹(Gu等人,2021年;Shi等人,2022年;Zhou等人,2023年)。尽管这些方法在一定程度上减轻了不确定性,但它们描述行为多样性的能力往往受到现有数据集单一标签性质的限制。如图1所示,当前的数据集通常只记录给定场景的一种实际行为。因此,即使使用多模态头部,模型也倾向于在数据中生成主导和常见的模式,并且难以覆盖现实世界驾驶中的各种行为类型。
为了扩展数据集并提高泛化能力,研究人员采用了数据增强策略,从启发式场景扰动(Ghiya等人,2025年;Li等人,2024年)到生成范式(如CVAE、GAN(Ding等人,2020年),以及最近的扩散模型和流匹配(Lipman等人,2022年;Liu等人,2025a年;Zhou等人,2025b年),这些方法通过迭代噪声优化来捕捉潜在的不确定性。视觉语言模型(VLMs)也通过引入语义先验为上下文感知的轨迹生成提供了新的方向(Song等人,2025a年)。尽管取得了这些进展,现有方法仍面临几个挑战。一方面,许多增强策略主要集中在提高对噪声扰动和环境变化的鲁棒性上,而缺乏对行为多样性的系统建模和控制。另一方面,生成模型中的随机或无约束采样可能会导致生成的轨迹违反场景结构或运动学约束,从而增加了合成数据与真实行为之间的分布差距,削弱了增强数据对模型泛化的实际贡献。
为了解决这些问题,我们提出了一种混合场景自适应增强框架HySA-Aug,旨在基于真实驾驶数据构建高保真度的增强流程。该框架从真实轨迹数据中构建了一个轨迹词汇表,并引入了分层规则约束,将道路拓扑、代理交互和运动学一致性整合到一个统一的过滤机制中,确保候选样本满足场景约束和物理可行性。在此基础上,我们设计了一个数据驱动的行为评分模块,通过建模分布差异来评估候选样本的真实性。结合基于场景拓扑的行为划分策略,该模块能够构建高质量和多样化的训练样本,从而提高评分过程的可靠性和覆盖范围。最后,我们采用了一种多监督回归训练框架,将过滤后的增强轨迹高效地整合到预测模型训练中,使模型能够更好地学习多样化的行为模式,同时保持预测准确性。
与之前依赖于随机扰动或无约束生成的增强方法不同,HySA-Aug建立在真实轨迹词汇表的基础上,并更加强调学习扩展的行为分布。约束和评分机制缓解了现有方法产生的增强轨迹中场景约束的缺失,并提高了轨迹与场景之间的一致性。本文的贡献总结如下:
•我们提出了一种混合场景自适应增强框架,利用真实驾驶数据,结合分层规则约束生成和数据驱动评分来生成具有丰富行为多样性的场景一致增强轨迹。
•引入了一种新的行为评分模块,通过建模特征分布差异来定量评估增强轨迹。基于场景拓扑的行为划分策略进一步确保在模块训练期间获取多样化和高质量的负样本。
•提出了一种基于多监督回归损失的训练策略,以高效地将增强轨迹整合到模型训练中,提高模型捕捉长尾行为和生成多样化输出的能力。
本文的其余部分结构如下:第2节回顾了与运动预测和数据增强相关的研究。第3节阐述了问题并提出所提出框架的概述。第4节详细介绍了所提出的场景自适应增强方法。第5节展示了实验结果和分析,第6节总结了本文并概述了未来的研究方向。
相关工作
多模态运动预测。
早期的运动预测方法通常依赖于单模态框架来生成确定性轨迹,这使得捕捉现实世界交互的固有随机性和潜在未来运动的多样性变得困难,特别是在复杂的交互环境中(Liu等人,2025c年;Yao和Sun,2025年;Zhao等人,2025年;Zhou等人,2025a年)。为了克服这些限制,已经开发了多模态预测方法问题表述
对于运动预测任务,模型使用过去Th时间步中目标代理的观察状态来预测未来Tf时间步内的未来状态Y,其中
场景自适应增强
本节介绍了所提出的HySA-Aug框架,包括规则约束的候选轨迹生成、数据驱动的行为评分以及基于多监督回归损失的增强轨迹与预测模型的集成策略。
数据集与指标
数据集。所提出的运动预测模型使用了Argoverse 1(Chang等人,2019年)、Argoverse 2(Wilson等人,2021年)和Waymo数据集(Ettinger等人,2021年)进行评估。Argoverse 1运动预测数据集包含324,557个场景,每个场景持续5秒,其中前2秒用作历史数据,后3秒用于预测。Argoverse 2数据集包括250,000个训练和验证场景,每个场景包含5秒的历史数据和6秒的未来数据
结论
本文提出了HySA-Aug,这是一种混合场景自适应增强框架,旨在促进对多样化未来行为的预测。该框架包括三个核心组件:规则约束的轨迹生成、数据驱动的行为评分以及与预测模型的无缝集成。我们首先从真实驾驶数据中构建了一个轨迹词汇表,以确保生成样本的动态可行性。应用了分层规则约束过滤器来强制执行
CRediT作者贡献声明
陆子恒:写作——审稿与编辑、撰写原始草稿、可视化、验证、软件、数据管理。蔡英峰:项目管理、方法论、资金获取。王海:项目管理、资金获取。孙晓强:形式分析。陈龙:调查。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号