基于非平稳多臂老虎机的在线雷达屏蔽脉冲宽度分配策略研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月28日 来源：Digital Signal Processing 2.9

编辑推荐：

　　推荐为应对具备瞬时频率测量（IFM）能力的干扰机对雷达系统的威胁，研究人员提出一种基于非平稳多臂老虎机（MAB）的在线雷达屏蔽脉冲宽度分配方法。该方法结合折扣历史奖励与滑动窗口奖励，显著提升收敛速度与探索能力，有效增强雷达在非平稳干扰环境中的抗干扰性能。

论文解读
在现代电子战中，雷达系统面临着来自具备瞬时频率测量（IFM）能力干扰机的严峻挑战。这类干扰机能够在极短时间内分析雷达信号频率特征，并迅速调整干扰策略，导致传统频率跳变雷达的屏蔽策略失效。特别是在非平稳干扰环境中，当干扰机策略发生突变时，若雷达未能及时调整屏蔽脉冲参数，其抗干扰效能将急剧下降。为解决这一问题，国内研究团队提出了一种基于非平稳多臂老虎机（MAB）的在线雷达屏蔽脉冲宽度分配算法。该算法通过融合折扣历史奖励与滑动窗口奖励机制，动态优化脉冲宽度分配策略，显著提升了雷达在复杂干扰环境中的适应性与鲁棒性。研究成果表明，该方法在收敛速度与探索能力方面均优于传统方法，为提升雷达系统在动态对抗中的生存能力提供了理论支撑与技术路径。该研究发表于《Digital Signal Processing》，为电子对抗领域提供了重要参考。

在技术实现层面，研究团队构建了融合折扣历史奖励与滑动窗口奖励的复合优化框架。其中，折扣历史奖励用于保留长期累积经验，而滑动窗口奖励则聚焦于近期环境变化，二者结合实现了对非平稳环境的自适应响应。此外，研究还引入了多臂老虎机（MAB）理论，将脉冲宽度分配问题转化为多选项探索与利用的平衡问题，通过UCB（Upper Confidence Bound）算法实现策略优化。

研究结果部分显示，所提方法在仿真环境中表现出显著优势。在收敛速度方面，相较于传统折扣方法，新算法能够更快适应干扰机策略突变，平均收敛时间缩短约37%。在探索能力方面，与滑动窗口方法相比，其策略多样性指数提升约22%，有效避免了局部最优陷阱。具体而言，当干扰机IFM时间从固定值突变为随机变化时，传统方法需约50次迭代才能恢复有效屏蔽，而新算法仅需28次即可实现稳定抗干扰。此外，在目标检测性能方面，新算法在强干扰环境下仍能保持约85%的检测概率，较基准方案提升约19%。

研究结论指出，非平稳多臂老虎机（MAB）框架通过动态整合历史与实时信息，为雷达脉冲宽度分配提供了创新性解决方案。该方法不仅突破了传统静态优化方法的局限性，还为复杂电子对抗环境下的自适应决策提供了理论依据。其工程应用价值体现在可显著降低雷达系统对干扰机参数的先验依赖，提升系统在实战中的生存能力。研究团队进一步指出，未来可将该框架拓展至多目标协同干扰场景，并结合深度强化学习技术进一步提升策略优化效率。

需特别强调的是，本研究提出的滑动窗口奖励机制通过设定动态观测窗口（如最近10次交互数据），有效捕捉了干扰机策略的突变特征。而UCB算法中的探索参数则通过理论推导自适应调整，确保了算法在收敛速度与稳定性间的平衡。这些技术创新为解决非平稳环境下的动态决策问题提供了可复用的方法论工具。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号