
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于事件触发ADP的非线性不确定系统约束跟踪控制:面向部分未知动态的鲁棒优化方法
【字体: 大 中 小 】 时间:2025年06月23日 来源:Neural Networks 6.0
编辑推荐:
针对非线性系统存在未建模动态、不匹配不确定性和输入/状态约束的难题,Raju Dahal团队提出了一种结合事件触发机制和自适应动态规划(ADP)的标识器-评价器框架。通过神经网络(NN)辨识未知漂移动态,构建含控制屏障函数(CBF)的安全HJB方程,实现了在约束条件下的最优跟踪控制。该成果发表于《Neural Networks》,为机器人、航空航天等安全关键系统提供了计算高效的鲁棒控制方案。
在机器人控制和航空航天等领域,精确跟踪参考轨迹的同时确保系统安全始终是核心挑战。传统控制方法如反馈线性化和滑模控制,虽能处理部分非线性问题,却严重依赖精确的系统模型。而现实中的非线性系统往往存在未建模动态、不匹配不确定性(即无法通过控制输入完全抵消的扰动),以及物理限制导致的输入饱和(如执行器力矩限制)和状态约束(如速度/位置安全边界)。更棘手的是,系统漂移动态(即无控制输入时的自然演化规律)可能完全未知,这使得基于模型的控制设计陷入困境。
针对这一系列难题,研究人员创新性地将事件触发机制与自适应动态规划(ADP)相结合。ADP作为强化学习(RL)在控制领域的应用,通过近似求解Hamilton-Jacobi-Bellman(HJB)方程来规避"维度灾难",但现有研究多聚焦于无约束或仅处理匹配不确定性的场景。本文首次在部分未知动态、不匹配不确定性、输入/状态约束三重挑战下,构建了事件触发的安全ADP框架。
关键技术包括:1)设计神经网络(NN)标识器在线估计未知漂移动态;2)将不匹配不确定性分解为匹配/不匹配分量,构建辅助系统转换跟踪问题为调节问题;3)在HJB方程中整合控制屏障函数(CBF)和非二次型代价项以强化约束;4)基于Lyapunov理论设计事件触发规则,仅在系统状态偏离安全边界时更新控制量。
问题描述
研究针对连续时间非线性系统?(t)=f(x(t))+g(x(t))u(t)+Δf(x(t)),其中漂移动态f(x)未知且含不匹配不确定性Δf(x)=k(x)d1(x)。控制输入ui(t)受饱和限制|ui|≤λ,状态x(t)需维持在安全集D内。
数据驱动标识器设计
通过分解不确定性Δf(x)=g(x)g+(x)k(x)d1(x)+(In-g(x)g+(x))k(x)d1(x),构建含辅助控制量v(t)的辅助系统。采用NN逼近未知f(x),权重更新律保证估计误差一致最终有界(UUB)。
控制屏障函数
引入CBF确保状态始终满足h(x)≥0,通过约束控制量导数?(x)≥-α(h(x))将安全要求嵌入优化问题。
事件触发安全HJB方程
定义跟踪误差er(t)=x(t)-xr(t),构建增广状态z(t)=[er?,xr?]?。在代价函数中加入CBF相关项,推导出新型事件触发HJB方程。触发条件基于Lyapunov函数V=ej?Pej设计,其中ej(t)=z(t)-z(tj)为采样间隔误差。
稳定性分析
证明在假设?σc(z) Lipschitz连续、G(z)等信号有界的条件下,闭环系统所有信号UUB。仿真以弹簧-质量-阻尼器系统验证理论,控制输入限幅λ=4,速度状态约束-1.1≤x2≤3.3。
该研究突破了传统ADP在多重约束下的应用瓶颈,首次实现部分未知动态、不匹配不确定性和状态/输入约束的协同处理。事件触发机制较时间触发节省47%控制更新次数,CBF确保100%状态安全。未来可扩展至多智能体系统和医疗机器人等安全关键领域。
生物通微信公众号
知名企业招聘