
-
生物通官微
陪你抓住生命科技
跳动的脉搏
通信失效下混合动力汽车队列的层次化优化控制策略:基于DMPC与PER-D2PG的协同能源管理
【字体: 大 中 小 】 时间:2025年05月30日 来源:iScience 4.6
编辑推荐:
为解决混合动力汽车(HEV)队列在通信失效场景下的安全性与能源效率问题,厦门大学与清华大学联合团队提出了一种基于分布式模型预测控制(DMPC)和优先经验回放-双深度确定性策略梯度(PER-D2PG)的层次化控制策略。该研究通过信号干扰噪声比(SINR)模型动态检测通信故障,结合知识-数据融合驱动的可信马尔可夫决策过程(TMDP),实现了车辆跟随、能源分配优化与电池健康管理的多目标协同。仿真表明,该策略在HWFET和LA92工况下较传统方法降低油耗最高达0.495L/100km,相关成果发表于《iScience》。
随着全球汽车保有量激增,道路通行效率下降和环境污染问题日益严峻。混合动力汽车(HEV)因其显著的节能潜力备受关注,但复杂的非线性动力学特性和通信网络的不稳定性给车辆队列控制带来双重挑战。传统规则型能量管理策略(EMS)优化效果有限,而深度强化学习(DRL)虽具备自适应优势,却在通信中断时存在安全性风险。更棘手的是,现有研究多局限于单车或理想通信场景,难以应对现实中的信号衰减、数据丢包等故障,这极大制约了HEV队列在智能交通系统中的实际应用。
厦门大学航空航天学院与清华大学车辆与运载学院的研究团队创新性地提出了一种层次化控制架构。该研究通过融合分布式模型预测控制(DMPC)与改进型深度强化学习算法,成功解决了通信失效下HEV队列的协同控制与能源优化难题。相关成果以《Hierarchical optimization control strategy of hybrid electric vehicle platoon under communication failure》为题发表在交叉学科期刊《iScience》上。
研究团队采用三项核心技术:首先建立信号干扰噪声比(SINR)模型量化通信质量,通过距离、路径损耗和无线干扰动态检测链路状态;其次开发基于DMPC的高层控制器,在预测时域内求解含通信指标的多目标优化问题;最后设计PER-D2PG算法,整合优先经验回放(PER)、竞争架构和动作分段技术提升学习效率。实验数据来自标准驾驶循环HWFET和LA92,包含高速公路和城市工况的实测速度轨迹。
系统模型构建
研究以搭载行星齿轮(PG)的功率分流型HEV为对象,建立包含发动机、电机、电池的耦合动力学模型。特别地,电池采用戴维南等效电路,其健康状态(SOC)通过开路电压Voc和内阻Rin动态计算。通信方面,设定5.9GHz专用短程通信(DSRC)频段,推导出SINR阈值β与传输成功概率的量化关系,当yij(k)<β时判定链路中断。
层次化控制架构
高层控制器采用DMPC处理动态拓扑,在领导者-前车跟随(LPF)默认模式下,代价函数同时考虑间距误差Δdij、速度误差Δvij和加速度平滑性。仿真显示,在HWFET循环中即使30%时段发生通信中断,跟随车辆仍能将间距误差控制在±0.5m内。低层控制器则通过PER-D2PG实现能量分配,其创新性地将发动机最优BSFC曲线作为先验知识嵌入动作空间划分,使72.3%的发动机工作点集中在高效区(BSFC<240g/kWh)。
算法性能验证
与传统DDPG相比,PER-D2PG的训练收敛速度提升38%,在LA92工况下SOC波动幅度减少63%。值得注意的是,该策略使电池SOC始终维持在0.5-0.6的最佳区间,相比DQN策略避免出现SOC<0.4的危险状态。燃料经济性测试表明,PER-D2PG在HWFET和LA92下的百公里油耗分别为3.837L和3.409L,较基准方法最高节油11.2%。
这项研究的意义在于首次实现了通信失效场景下HEV队列控制与能源管理的协同优化。通过构建SINR-DMPC-PER-D2PG的技术链条,不仅解决了传统方法在动态拓扑中的适应性问题,还通过知识-数据融合显著提升了DRL的训练效率和安全性。作者Jingyao Wang等特别指出,该框架可扩展至异构车队控制,为智能交通系统的可靠性和节能性提供了新思路。研究存在的局限性包括未考虑多径衰落对通信模型的影响,以及车载计算资源的实时性约束,这些将是未来改进的重点方向。
生物通微信公众号
知名企业招聘