
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于联邦学习与深度确定性策略梯度的车辆轨迹预测方法FedDDPG:解决非独立同分布数据下的隐私保护与预测精度提升
【字体: 大 中 小 】 时间:2025年07月20日 来源:Array 2.7
编辑推荐:
针对车联网(IoV)中车辆轨迹预测(VTP)面临的分布式数据收集难、轨迹隐私保护及噪声干扰等挑战,研究人员提出基于强化学习(RL)的联邦学习(FL)优化方案FedDDPG。该方法通过深度确定性策略梯度(DDPG)动态生成聚合权重,在NGSIM数据集实验中显著提升非独立同分布(non-IID)场景下的预测精度(RMSE降低12.3%),同时保持较低通信开销,为智能交通系统的安全决策提供新思路。
在智能交通系统快速发展的今天,车辆轨迹预测(Vehicle Trajectory Prediction, VTP)技术已成为保障行车安全的关键支撑。通过准确预测周边车辆的行驶轨迹,智能网联汽车(Connected and Automated Vehicles, CAVs)能够提前规划路径,有效避免交通事故。然而,这一技术在实际应用中面临两大难题:一方面,轨迹数据分散在不同路侧单元(Roadside Units, RSUs)中,存在严重的非独立同分布(non-IID)特性;另一方面,轨迹数据涉及用户隐私,传统集中式训练模式存在隐私泄露风险。更棘手的是,RSUs采集的轨迹数据常包含不同程度的噪声干扰,这对预测模型的鲁棒性提出了更高要求。
针对这些挑战,研究人员创新性地将联邦学习(Federated Learning, FL)与强化学习(Reinforcement Learning, RL)相结合,提出名为FedDDPG的新型解决方案。该方法的核心突破在于将FL中的权重聚合问题建模为马尔可夫决策过程(Markov Decision Process, MDP),并采用深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)算法动态优化聚合权重。通过设计包含客户端损失函数、数据量和模型相似度等要素的状态空间,以及融合优化奖励和误差奖励的复合奖励机制,FedDDPG能够智能调整不同客户端的贡献权重,从而有效应对数据异质性问题。
为验证方法有效性,研究团队在NGSIM真实轨迹数据集上进行了系统实验。通过引入低(σ=0.1)、中(σ=0.3)、高(σ=0.5)三级高斯噪声模拟非理想环境,对比测试显示FedDDPG在中等噪声下的预测误差(RMSE)仅为3.75,显著优于FedAvg(4.27)和FedProx(4.19)等基准方法。特别值得注意的是,在高噪声环境下,FedDDPG仍能保持4.48的RMSE值,展现出卓越的鲁棒性。在计算效率方面,FedDDPG单轮聚合仅增加87ms耗时,远低于FedOPT的187ms额外开销。此外,通过系数变异(cv)和最差客户端精度(RMSE)评估的公平性指标显示,FedDDPG在中等噪声下的cv值为12.80,明显优于FedAvg的24.95,证实其能有效平衡不同客户端的训练效果。
这项研究的意义不仅在于提出了一个高效的车辆轨迹预测框架,更开创性地将强化学习引入联邦学习的权重优化过程。FedDDPG的成功实践表明,通过智能算法设计,可以在不共享原始数据的前提下,充分利用分布式数据的价值,这对医疗、金融等隐私敏感领域的协同学习具有重要借鉴意义。论文的创新成果已发表在《Array》期刊,为智能交通系统的算法设计提供了新范式。未来,研究团队计划将FedDDPG扩展至医疗影像诊断、工业设备预测性维护等更多跨域协作场景,并探索结合区块链技术进一步增强隐私保护能力。尽管深度强化学习的参数调优复杂度仍是规模化部署的挑战,但这项研究无疑为破解"数据孤岛"困境开辟了新的技术路径。
生物通微信公众号
知名企业招聘