四旋翼飞行器状态依赖Riccati方程与迭代学习控制的实验研究
《Robotica》:Experimental iterative learning control of a quadrotor in flight: A derivation of the state-dependent Riccati equation method
【字体:
大
中
小
】
时间:2025年12月12日
来源:Robotica 2.7
编辑推荐:
本文针对无人机在重复性轨迹跟踪任务中存在的精度不足问题,提出了一种结合状态依赖Riccati方程(SDRE)与迭代学习控制(ILC)的新型混合控制策略。研究人员通过理论推导和飞行实验验证了该方法能够在不稳定飞行环境中实现渐进式精度提升,首次实现了SDRE-ILC组合控制在移动飞行平台上的成功应用。该研究为非线性系统的高精度控制提供了重要技术参考,对自主无人系统的智能控制发展具有推动作用。
在自主无人系统飞速发展的今天,四旋翼无人机凭借其独特的机动性能已成为工业检测、农业植保等领域的重要工具。然而,这些应用场景往往要求无人机能够精确重复执行特定飞行轨迹,例如定期巡检固定路线或重复执行喷洒作业。传统控制方法在面对此类重复性任务时存在明显局限——它们无法从历史执行经验中学习改进,导致每次执行都会重复相同的跟踪误差。更严峻的是,在飞行系统中测试新型学习算法风险极高,一次不稳定的学习过程就可能导致飞行器坠毁,这不仅会造成设备损失,还可能带来安全隐患。
针对这一挑战,来自西班牙塞维利亚大学GRVC机器人实验室的研究团队在《Robotica》期刊上发表了一项创新性研究。他们巧妙地将状态依赖Riccati方程(SDRE)这一非线性最优控制方法,与迭代学习控制(ILC)这一能够从重复执行中学习改进的控制策略相结合,形成了一种既保证飞行安全又能逐步提升精度的混合控制方案。该方法的核心思想是让SDRE控制器作为"基础稳定器",确保即使在最初的学习循环中,无人机也能保持基本稳定飞行;而ILC则作为"精度提升器",通过分析每次飞行的误差数据,不断调整控制输入,使无人机在重复执行同一轨迹时表现越来越精准。
研究团队采用梯度下降法作为ILC的训练机制,通过最小化实际控制输入与理想系统动态之间的差异来更新学习项。在理论层面,他们详细推导了四旋翼无人机六自由度模型的SDC参数化过程,将复杂的非线性动力学系统转化为状态依赖系数形式,为SDRE控制器的设计奠定了理论基础。特别值得注意的是,研究人员采用了级联控制结构来应对四旋翼系统的欠驱动特性——先设计平移控制器生成虚拟力向量,再根据该向量计算所需的姿态角,最后设计姿态控制器实现精准跟踪。
在实验验证方面,研究人员自主开发了定制化的四旋翼实验平台,该平台配备了DJI E305无刷电机和DJI 9450型号螺旋桨,总质量为1.781kg。飞行实验在配备28个OptiTrack运动捕捉摄像头的室内测试场进行,能够提供精度约2mm的全状态反馈。实验设计了半径为3米的圆形轨迹跟踪任务,飞行高度保持0.65米,每个学习循环持续约35秒。为了防止电池电压下降对学习过程产生干扰,实验仅限于三个学习循环。
关键技术方法包括:状态依赖Riccati方程控制器设计,用于保证系统基础稳定性;梯度下降法的迭代学习控制,用于实现性能逐步提升;四旋翼动力学模型的SDC参数化,将非线性系统转化为伪线性形式;以及基于运动捕捉系统的全状态反馈控制,实验平台采用Raspberry Pi 3B+作为主处理器,通过PCA9685模块生成PWM信号控制电机。
研究团队首先建立了SDRE控制框架,通过状态依赖系数参数化将非线性系统转化为伪线性形式。控制律设计包含两个部分:基础SDRE反馈项和ILC前馈项。SDRE部分通过求解状态依赖Riccati方程获得最优控制增益,确保系统在李雅普诺夫意义下的稳定性。ILC部分则通过梯度下降法训练前馈项,其训练准则定义为学习项与期望系统动态之间的差异最小化。这种组合结构使得系统在首次执行时就有基本稳定性保障,同时在重复执行中不断优化性能。
四旋翼动力学模型采用六自由度描述,状态变量包括惯性系中的位置、欧拉角以及机体坐标系中的线速度和角速度。通过两个变换矩阵——旋转矩阵RXYZ(ξ2(t))和变换矩阵T(ξ2(t)),建立了局部坐标系与全局坐标系之间的运动学关系。完整的动力学方程考虑了科里奥利力、离心力以及陀螺效应等非线性因素,为控制器的设计提供了准确的被控对象模型。
针对四旋翼的欠驱动特性,研究采用了级联控制策略。平移控制器基于SDRE设计,产生虚拟力向量,然后通过逆动力学计算得到所需的滚转角和俯仰角。姿态控制器独立设计,确保无人机能够快速准确地跟踪这些期望角度。在软件实现上,控制算法在Ubuntu操作系统上通过Python实现,利用ROS节点接收OptiTrack系统的位置反馈,并通过PCA9685模块生成PWM信号驱动电机。
仿真结果表明,SDRE-ILC组合控制器在30个学习循环内将轨迹跟踪误差从初始的1.5米降低到0.14米,性能显著优于传统的PD-ILC控制器。飞行实验进一步验证了控制策略的有效性,尽管出于安全考虑只进行了三个学习循环,且学习速率设置得较为保守,但依然观察到了明显的误差收敛趋势。三维位置误差从第一个循环的0.2769米降低到第三个循环的0.1407米,平面误差也呈现类似改进模式。12次重复实验均证实了结果的可靠性,误差中位数从0.2885米逐步下降到0.1540米。
本研究首次成功将SDRE与ILC组合控制策略应用于真实四旋翼飞行器的轨迹跟踪任务中,实现了在保证飞行安全前提下的性能逐步优化。SDRE控制器作为基础稳定器有效防止了学习初期的不稳定现象,而ILC则通过利用重复执行的经验持续改进跟踪精度。实验结果表明,即使在实际飞行环境中存在模型失配和外部干扰的情况下,该控制策略仍能实现误差的渐进式减小。
这项研究的重要意义在于为移动学习系统提供了一种安全有效的控制范式,特别适用于需要重复执行精确任务的无人机应用场景。与需要大量训练数据或存在高风险试错的传统学习方法相比,SDRE-ILC组合策略能够在保证系统安全的前提下实现渐进式性能提升。该方法为无人机在精准农业、基础设施检测等领域的自动化作业提供了技术支撑,也为更广泛的自主系统智能控制研究开辟了新方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号