
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于强化学习的动态事件触发无人艇抗干扰最优轨迹跟踪控制
【字体: 大 中 小 】 时间:2025年07月26日 来源:Ocean Engineering 4.6
编辑推荐:
本文针对无人艇(USV)在未知海洋干扰下的轨迹跟踪问题,提出了一种融合强化学习(RL)、扰动观测器和动态事件触发机制的创新控制方案。研究团队通过RBF神经网络逼近HJB方程,结合自适应反步法设计控制器,实现了小误差可调的位置跟踪,同时通过动态事件触发机制有效降低了执行器磨损。仿真结果表明该方案在保证半全局一致最终有界性的同时,显著减少了控制信号更新频率。
在智能海洋建设的浪潮中,无人水面艇(USV)正成为军事和民用领域的新宠。然而,这些"海上机器人"在执行轨迹跟踪任务时,面临着双重挑战:一方面,变幻莫测的风浪洋流会干扰其航行精度;另一方面,传统控制方法往往只关注任务完成度,却忽视了执行器在持续高频控制信号下的"过劳死"问题。更棘手的是,现有的抗干扰控制方案多采用静态事件触发或单纯依靠鲁棒控制,难以兼顾控制精度与设备损耗。
针对这一工程难题,大连海事大学的研究团队在《Ocean Engineering》发表了一项突破性研究。他们巧妙地将强化学习(RL)的"智能决策"能力、扰动观测器的"环境感知"特性,以及动态事件触发机制的"节能"优势融为一体,为USV打造了一套"会思考、能应变、懂节制"的智能控制系统。
研究团队采用了三项核心技术:首先构建扰动观测器实时估计未知干扰,随后通过演员-评论家(actor-critic)架构的RL算法重构代价函数和控制器,利用RBF神经网络逼近难以解析求解的Hamilton-Jacobi-Bellman(HJB)方程,最后引入带一阶滤波的动态事件触发机制,使执行器仅在必要时工作。这种"三位一体"的设计思路,既保证了系统对外界干扰的"免疫力",又延长了执行器的"使用寿命"。
扰动观测器设计
通过建立辅助状态方程和Lyapunov函数,研究者证明了观测误差的收敛性。当增益矩阵Kd满足特定条件时,扰动估计误差d?(t)能指数收敛,为后续控制提供精准的环境感知。
RL控制器构建
采用RBF神经网络逼近策略,解决了HJB方程"维数灾难"难题。自适应反步法设计的控制律,确保了跟踪误差的渐进稳定性,同时使预设性能指标函数达到最优。
动态事件触发机制
创新性地在触发条件中引入一阶滤波器,将控制信号更新频率降低65.7%。与静态触发相比,该机制在相同干扰强度下减少28.4%的执行次数,显著缓解执行器磨损。
仿真验证
以1:70的CyberShip II为对象,在两种不同干扰场景下的测试表明:位置跟踪误差可控制在0.05m以内,航向角误差不超过0.02rad,同时执行器工作频率下降至传统方法的1/3。
这项研究的突破性在于首次将RL、动态事件触发和扰动观测进行协同设计。相比Wen等(2019b)的静态RL控制,新方案在保持相同跟踪精度的同时,执行器寿命预计可延长2-3倍;相较于Gao等(2023a)的有限时间观测器方法,本研究的扰动估计精度提升约40%。这些创新不仅为USV的长期可靠运行提供了解决方案,更为复杂环境下的智能控制开辟了新思路——正如研究者所言:"让机器学会在精确与节能间寻找平衡,才是真正的智能。"
该成果的特殊意义还体现在工程转化价值上。通过国家自然科学基金等项目的支持,研究团队已开始在真实USV平台上测试这套算法。可以预见,这种"既精明又节俭"的控制策略,未来将在海洋测绘、灾害救援等长航时任务中发挥重要作用,让USV真正成为"不知疲倦的海洋守护者"。
生物通微信公众号
知名企业招聘