基于图卷积软行动者-批评家算法的联网自动驾驶环境应急车辆车道协同清障方法

【字体: 时间:2025年06月03日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对应急车辆(EV)在动态交通场景中通行效率低的问题,清华大学研究团队提出一种融合图卷积网络(GCN)与多智能体强化学习(MARL)的分布式控制框架GSAC。该算法通过设计纵向-横向协同奖励函数和分段清障策略,实现了EV无中断通行速度提升25 m/s,CAV群体延迟降低30%,为智能交通系统提供了高效可扩展的解决方案。

  

在城市应急救援体系中,救护车、消防车等应急车辆(EV)的响应速度直接关系到生命财产抢救成功率。研究表明,心脏骤停患者存活率每分钟下降7-10%(Brooks et al., 2015),火灾黄金救援窗口仅1-5分钟(Jaldell, 2017)。然而传统交通系统中,EV常被社会车辆阻挡被迫降速变道,现有基于混合整数规划(MNILP)的清障方法存在控制精度低(需0.5m网格离散)、计算耗时长(超1000秒)等缺陷(Lin et al., 2023)。

清华大学团队在《Expert Systems with Applications》发表的研究中,创新性地将车道清障问题建模为动态拓扑多智能体强化学习(MARL)任务。通过构建参数共享的分布式训练框架,开发了集成图卷积网络(GCN)与软行动者-批评家(SAC)的GSAC算法,在Highway-env仿真平台上验证了其性能。关键技术包括:1)设计包含18维状态空间和5维动作空间的连续控制模型;2)采用双层GCN处理时变通信拓扑;3)创新纵向(跟驰)与横向(变道)协同奖励机制;4)提出分段清障-再加速策略应对长路段场景。

【Model-Based Control Methods】
对比传统最优控制、模型预测控制(MPC)等方法的局限性,研究指出空间离散化导致网格边缘车辆定位模糊,且集中式V2I部署成本高昂。

【Preliminaries of RL】
建立马尔可夫决策过程(MDP)模型,状态st包含相对位置、速度等特征,动作at控制加速度/转向角,奖励函数rt平衡EV通行效率与CAV群体影响。

【Simulation environment and scenarios】
在750米道路设置4类测试场景,GSAC在25 m/s目标速度下实现:1)碰撞率较ILP方法降低82%;2)任务完成率提升至98.7%;3)CAV平均延迟仅2.3秒。

【Conclusions and discussions】
该研究突破传统方法在复杂交通流中的性能瓶颈,GSAC算法展现出三大优势:1)支持厘米级连续空间控制;2)决策耗时<10ms满足实时性;3)参数共享架构实现小规模训练大规模部署。实验证实其在车流密度200辆/km2时仍保持稳定,为智能交通系统提供新范式。

研究获得国家自然科学基金(52325209)和中国博士后科学基金(GZB20230370)支持,相关技术已申请专利。Xu Yang等作者强调,未来将拓展至多EV协同及恶劣天气场景,推动CAV技术在应急救援领域的产业化应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号