多无人艇系统协同拦截入侵目标的智能决策与自适应抗干扰导航控制算法研究

《Journal of Marine Science and Engineering》:Adaptive Dynamic Prediction-Based Cooperative Interception Control Algorithm for Multi-Type Unmanned Surface Vessels

【字体: 时间:2026年01月03日 来源:Journal of Marine Science and Engineering 2.8

编辑推荐:

  本文针对多无人艇(USV)系统在复杂海洋环境中协同拦截入侵目标的关键技术问题,提出了一种创新的智能决策与自适应抗干扰导航控制算法。文章深入探讨了基于威胁评估的动态目标分配策略,并利用扩展卡尔曼滤波(EKF)预测入侵目标未来位置。核心贡献在于设计了一种两阶段(Two-stage)架构的自适应抗干扰导航控制算法,该算法通过强化学习(DQN)训练,能够有效应对风、流等环境干扰,显著提升USV在拦截任务中的导航精度和系统协同效率。研究为解决海上安全防护中的动态目标协同拦截难题提供了重要的理论依据和技术路径。

  

系统架构与任务描述

多无人艇(USV)协同拦截系统旨在应对海上区域可能出现的入侵目标威胁。该系统核心由任务控制中心(TGuard)和若干执行拦截任务的无人艇(USVi, i=1,2,...,NU)构成。系统运行伊始,TGuard根据预设策略将待保护区域划分为多个子区域,并为每个USVi分配初始巡逻路径。当系统探测到入侵目标集 I = {I1, I2, ..., INI} 后,TGuard迅速启动协同拦截决策流程。该流程首先对每个入侵目标Ij进行动态威胁评估,随后根据评估结果和“资源匹配原则”为每个Ij分配合适数量的USV执行拦截任务,优先确保高威胁目标获得充足的拦截资源。

入侵目标威胁评估与动态分配模型

威胁评估是动态目标分配的基础。对于入侵目标Ij,其威胁值wm(j)由多个因素共同决定,主要包括目标与保护区域中心的位置关系、目标的速度特性以及目标的运动方向。具体的威胁值计算模型综合考虑了目标的相对距离、接近速度和航向角。为了便于决策,将连续威胁值wm(j)映射到离散的威胁等级Level(wm(j))。通过将威胁值区间[wmin, wmax]均匀划分为Mw个不重叠的子区间,根据wm(j)落入的区间确定其威胁等级t。在分配过程中,TGuard优先为高威胁等级的入侵目标分配USV,并且计算每个USVi到每个Ij的距离DistIj= (DistUSV1Ij, DistUSV2Ij, ..., DistUSViIj),选择距离最近的USV进行指派,以确保拦截的时效性。

入侵目标位置的预测

由于入侵目标始终处于运动状态,若USV仍以其被探测时的位置作为导航目标,极易导致协同拦截任务失败。为解决未来时刻入侵目标位置的预测问题,采用了扩展卡尔曼滤波(EKF)建立相应的位置预测模型。该模型基于目标当前的运动状态信息MIj(k)(包括位置、速度、航向等),通过状态预测方程和量测方程,递归地预测其在未来时刻的状态。状态预测方程描述了系统状态随时间的演化,而量测方程则建立了状态量与观测量之间的关系。通过计算雅可比矩阵FIj(k-1),并进行状态预测和协方差预测,最终通过卡尔曼增益KIj(k)更新状态估计值和协方差矩阵,得到更精确的预测结果M?Ij(k|k)。为了提高预测的稳健性,算法采用了多步平均预测方法,即基于当前状态进行多次独立的单步预测,然后对预测结果取平均,以减小单次预测随机误差的影响。多步预测的步长n的选择结合了“目标运动复杂性”和“USV系统响应延迟”两个因素,确保预测范围能够覆盖USV响应延迟时间内目标的运动范围。

自适应抗干扰导航控制算法

为了提升USV在复杂海洋环境中执行拦截任务的导航精度,提出了自适应抗干扰导航控制算法。该算法采用改进的两阶段(Two-stage)模型控制架构。协同包围控制模块负责根据更新的导航状态信息(包括自身状态、目标状态和其他USV状态)输出包围导航控制量,驱使USV快速准确地接近拦截目标,并产生协同包围行为。抗干扰导航控制模块则融合采集到的环境干扰量和协同包围控制模块输出的导航控制量,采用端到端(end-to-end)的方式,生成USV的抗干扰导航控制量。该算法的训练基于深度Q网络(DQN)实现。DQN对离散动作具有更好的拟合精度,有助于减少航向补偿角的决策误差,满足减小航向角波动的性能指标。

算法训练与实现细节

在算法训练过程中,USVi在k时刻获得的状态值si(k)包含了风(wind)和流(current)的干扰状态信息。风对USV的干扰主要体现在对船体的侧向力上,其大小与风速、风向、船体侧向投影面积以及阻力系数等因素相关。流对USV的影响则会导致其实际航迹偏离预期航迹,产生漂移。算法通过分析风、流干扰下的运动学关系,计算出为抵消环境干扰所需的航向补偿角ΔθH。该补偿角作为自适应抗干扰导航控制算法的动作值。奖励函数的设计以确保USV具有抗干扰导航能力为目标,基于USV采取相应控制指令后的实际航向角θsailing(k)与期望航向角θi(k)的绝对偏差(定义为干扰航向偏差角θdeviation(k))以及该偏差随时间的变化趋势(Δθdeviation(k))来确定奖励值ri(k)。通过合理设计奖励值,引导算法学习出能够在风、流干扰下保持稳定、准确导航的控制策略。

总结

本研究系统地提出并阐述了一套用于多USV系统协同拦截入侵目标的完整技术框架。该框架涵盖了从入侵目标威胁评估、动态分配到目标运动预测,再到USV自适应抗干扰导航控制的各个环节。通过智能决策与先进控制算法的结合,显著提升了多USV系统在复杂海洋环境下执行协同拦截任务的整体效能和鲁棒性,为海上安全防护领域的应用提供了有力的技术支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号