
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用专家学习的战术规划拦截增强技术——双延迟深度确定性策略梯度
《IEEE Transactions on Intelligent Vehicles》:Tactical Planning Interception Enhancement using Expert Learning - Twin Delayed Deep Deterministic Policy Gradient
【字体: 大 中 小 】 时间:2025年11月24日 来源:IEEE Transactions on Intelligent Vehicles 14.3
编辑推荐:
精准拦截对抗无人机是保障人员和国家安全设施的关键。城市环境因建筑物密集和飞行限制给拦截算法带来挑战,传统深度强化学习(DRL)在跨场景泛化上存在局限。本文提出基于双延迟确定性策略梯度(TD3)的专家在线混合学习算法,通过动态融合专家历史策略与在线探索数据,有效优化奖励函数与动作分布,提升算法在多样化城市场景中的鲁棒性和收敛速度。对比实验表明该方法优于传统DRL基线算法。
生物通微信公众号
知名企业招聘