《Array》:Attitude intelligent control methods for morphing aircraft: review and prospects
编辑推荐:
新兴人工智能(AI)技术在计算机视觉、自动驾驶和机器人控制等领域的实际应用,为变形飞行器的深度技术创新提供了重要的理论启示和方法论参考。相比传统飞行器,变形飞行器在结构和飞行模式等方面具有特殊性,因此其面临的控制挑战更加复杂和艰巨。然而,AI技术强大的自适应学
新兴人工智能(AI)技术在计算机视觉、自动驾驶和机器人控制等领域的实际应用,为变形飞行器的深度技术创新提供了重要的理论启示和方法论参考。相比传统飞行器,变形飞行器在结构和飞行模式等方面具有特殊性,因此其面临的控制挑战更加复杂和艰巨。然而,AI技术强大的自适应学习和复杂数据处理特性,恰恰为解决这些难题提供了新思路。本文聚焦于综述对变形飞行器稳定性和安全性具有关键影响的姿态控制研究。研究人员首先简要介绍了变形飞行器的定义,并根据常见的变形飞行器类型将其分为四类,同时提供了本文的研究背景和动机。接着,介绍了变形飞行器姿态控制方法的分类,并重点梳理了过去十年间基于智能控制方法的工作,包括模糊控制、神经网络控制和强化学习(RL)控制。最后,对综述内容进行了总结与讨论,探讨了变形飞行器在姿态智能控制中尚未解决的问题,并展望了未来发展方向。
**1. 引言**
**1.1. 定义与分类**
变形飞行器是指在飞行过程中能自主改变自身形状与结构,以适应不同飞行任务、环境条件和性能要求的飞行器。由于机翼提供了绝大部分升力和操纵力,且对飞行器气动力影响最大,常见变形飞行器主要通过改变机翼形状来改变自身气动性能,这导致机翼参数发生变化,包括展长、弦长、厚度、弯度、后掠角等。合理改变机翼参数可提升气动特性和控制性能,带来如增大升阻比、提升飞行速度、延长续航时间等优势,直接影响飞行性能。根据变形尺度,变形机翼飞行器可分为微尺度、中尺度和大尺度变形。微尺度变形通过对局部结构轻微变形实现抖振控制、颤振抑制等;中尺度变形通过局部变形实现复杂飞行环境下的最佳性能,包括变厚度、变弯度、变扭转角等;大尺度变形通过改变整体气动布局以满足多种飞行任务需求,包括变展长、变后掠、变弦长等。此外,根据自由度,变形飞行器可分为面内变形、面外变形和翼型变形,本文在此基础上增加了第四类:组合变形。组合变形指飞行器上多个机翼参数同时或连续变化以优化不同飞行阶段的性能,能带来更高的升阻比、更低的阻力或更好的机动性,但也对飞行控制系统设计提出新挑战,如多变形模式叠加导致气动参数与飞行姿态间的强耦合效应,可能产生控制冗余,且多自由度变形导致的模型非线性和不确定性是传统控制方法难以处理的瓶颈。
**1.2. 背景与动机**
飞行器在军事和民用领域扮演着关键角色,如灾难救援、环境监测、高空侦察、突防和集群压制等。当前工作环境日益复杂,新一代飞行器需在复杂环境或多任务执行中始终保持良好性能。变形飞行器凭借其显著的灵活性和机动性优势,在智能材料与结构等关键技术支撑下,已成为航空、航天和兵器领域最具战略性、前沿性和交叉性的研究热点之一。然而,现代飞行器本身具有非线性、强耦合、快时变和不确定性等特点,与变形过程中产生的气动和结构质量变化相耦合,进一步影响动力学模型,使控制更加复杂。传统控制设计方法通常需要精确知识或识别飞行器内部动态信息,但所需输出变量的高阶导数在实际应用中难以测量。当制导与控制系统的动力学阶次较高时,问题维度的增加会降低算法效率,无法满足在线系统的实时性要求。此外,在实际飞行中,俯仰、偏航和滚转通道并非独立运行,极易受到变形飞行过程中的各种内外干扰。姿态控制性能对飞行稳定性和安全性起决定性作用,一旦失控后果严重。近年来,AI技术快速发展,其许多方法(如模糊理论、深度学习、RL)在飞行器控制领域受到广泛关注,可对变形飞行器控制系统的关键环节进行智能化升级改造,使其具备智能学习能力。因此,研究变形飞行器飞行过程中的姿态智能控制方法具有重要意义,体现在三个方面:(1) 为自主飞行提供技术基础;(2) 确保飞行安全可靠性;(3) 促进拓展应用范围的实现。据作者所知,这是第一篇针对变形飞行器姿态智能控制方法的详细综述。
**2. 相关工作**
姿态控制技术涉及飞行器的姿态稳定与调整,包括滚转、俯仰和偏航等自由度的控制,是确保飞行器稳定安全执行任务的关键技术之一。当前文献中变形飞行器的姿态控制方法可按两种方式分类:(1) 按变形控制方式分为外部输入变形指令控制和变形-姿态一体化控制。(2) 按控制算法类型分为传统控制和智能控制。智能控制方法可分为模糊推理型、数据驱动型和交互决策型,当前常用方法包括模糊控制、神经网络控制和RL控制。本文对过去十年(2015-2026年)的文献进行了全面检索,使用Web of Science核心合集,通过主题搜索策略,第一阶段获取2703篇关于变形飞行器的文献,第二阶段聚焦姿态与智能控制,获取277篇出版物。通过VOSviewer进行关键词共现聚类和时间叠加可视化分析,结果显示智能控制方法正被广泛采用以应对变形飞行器的强非线性和不确定性挑战,研究焦点正从基础动力学建模转向数据驱动的姿态智能控制方法。
**2.1. 模糊控制**
模糊控制基于模糊集合理论、模糊语言变量和模糊逻辑推理,不依赖精确数学模型,能很好处理变形飞行器动态行为的不确定性和非线性特性。典型模糊动态模型是T-S模糊模型,它将前提部分按系统局部输入输出是否线性关系划分,将这种线性关系作为结论部分,然后通过模糊规则组合使非线性系统全局输出具有良好的线性描述特性。基于T-S模糊模型的控制器利用现有线性控制理论方法,广泛应用于工程领域。文献[147]针对高超声速变形飞行器(HMA)在构型切换过程中因气动参数变化、模型不确定性和外部干扰导致的姿态控制问题,设计了基于T-S模糊模型的模糊前馈加鲁棒状态反馈控制器,能处理模型不确定性和外部干扰,使姿态角精确跟踪预设参考信号并在切换过程中保持稳定。文献[148]研究了变展长飞行器变形飞行过程中的协同控制问题,结合鲁棒
∞控制思想和模糊Lyapunov函数,提出了基于T-S模糊模型的模糊鲁棒∞控制(FRHC)方法。文献[149]研究了变形飞行器在栖息机动中的应用,通过轨迹线性化和张量积变换方法获得T-S模糊模型,基于Lyapunov稳定性理论和平方和方法设计了满足控制输入约束的多项式模糊控制器,其内部矩阵元素是关于状态变量x的多项式,能更好处理非线性系统。文献[150]以Firebee变后掠飞行器为研究对象,建立了基于牛顿-欧拉方法的六自由度多刚体动力学模型,基于T-S模糊控制理论设计了模糊控制器控制纵向运动,仿真表明控制器能较好维持变形过程中的姿态稳定性。文献[151]基于T-S模糊理论研究变展长飞行器的建模与跟踪控制问题,采用雅可比线性化方法和T-S模糊理论建立模糊模型,基于极点配置和并行分布补偿方法设计了全局T-S模糊控制器。为增强模糊系统描述和处理不确定性的能力,T-S-K模糊模型(TSK)也被应用于变形飞行器建模,其后件可以是更一般的函数形式。文献[152]针对HMA在机翼伸缩模式下的平滑过渡问题,构建了二型TSK模糊逻辑系统,采用高斯隶属函数描述不确定性,提出基于二型TSK模糊滑模控制(SMC)的自适应切换控制方案。此外,部分学者从不同角度探索了基于模糊干扰观测器的控制策略。文献[153]针对HMA姿态控制问题,提出固定时间模糊干扰观测器与固定时间SMC相结合的方案(FSMC-FFDO),基于固定时间收敛理论和模糊逻辑系统设计FFDO,通过调整参数使估计误差收敛到零,增强系统鲁棒性。文献[154]设计了新的自适应FFDO,获得更清晰的稳定时间,同时开发了具有强鲁棒性和高适应性的有限时间飞行控制策略。文献[155]将卡尔曼滤波与T-S模糊控制器结合,解决了变形过程中结构变化导致气动特性变化且系统状态不可测或测量不准确的问题。文献[156]设计了具有模糊切换增益调节功能的积分SMC方案,使用线性分式形式(LFR)设计有限时间收敛的积分滑模面,引入模糊切换增益调节方法消除干扰和不确定性,仿真表明该方法能在存在大干扰和不确定性的情况下保证变形过程中的姿态稳定性。
**2.2. 神经网络控制**
神经网络控制将神经网络与控制理论结合,能对难以精确描述的复杂非线性对象进行建模,作为观测器、估计器或控制器等。神经网络通常与传统控制方法结合实现复杂环境下的自适应控制。文献[159]针对具有未知参数和输入输出约束的变形飞行器纵向动力学模型,采用反步技术设计了基于障碍Lyapunov函数的自适应神经动态面控制器,仿真表明该控制器能保证变后掠飞行器在固定构型和变形过程中的姿态稳定和良好跟踪性能。作者还将动力系统解耦为高度和速度子系统,分别提出基于高阶积分链微分器的自适应神经网络控制方法和基于神经网络的动态逆方法[160]。文献[161]针对变展长飞行器飞行控制问题,提出基于神经网络的非线性动态逆控制(DIC)方法,通过训练前馈神经网络学习多种构型和飞行条件下的逆动力学,结合姿态控制系统和在线自适应机制,能在飞行器机动时稳定姿态并跟踪期望角速率。文献[162]研究了变后掠飞行器变形过程中的姿态控制问题,提出基于神经网络的PID自适应DIC方法,将PID参数设为神经网络隐含层节点,利用神经网络自适应调整PID参数,比传统PID控制能更高效地稳定姿态角。文献[163]提出了类似方法,能有效快速调整变后掠飞行器姿态角。为提升未知干扰或参数不准确时的鲁棒性,常用基于神经网络干扰观测器或补偿器的方法。文献[164]针对HMA受大尺度变形和跨域飞行引起的快速时变外部干扰和模型不确定性,提出基于神经网络观测器的预定时间SMC方法,确保姿态跟踪误差在预定时间内收敛到原点附近。文献[165]针对不对称时变约束下变形飞行器的姿态跟踪控制问题,提出基于自适应全反馈递归神经网络(AFFRNN)和广义障碍函数的预定时间控制方法,AFFRNN结构使网络能同时捕获内部状态和估计信息,增强在高动态变化干扰场景下的稳定性和估计能力。文献[166]针对一种新型嵌入式可倾V尾变后掠飞行器,提出自适应反步神经网络控制方法,引入径向基函数神经网络(RBFNN)逼近未知非线性函数,不再需要精确气动参数先验知识,实现飞机纵向和横向运动的精确跟踪。文献[167]基于相同思想设计了自适应神经控制器,并通过数值仿真和硬件在环(HIL)仿真验证了有效性。文献[168]针对变形飞行器机翼过渡过程中气动参数和模型参数变化导致的系统不确定干扰,提出基于RBFNN的自适应反步控制(BC)方法,利用RBFNN快速收敛和强逼近能力估计未知干扰并通过自适应律补偿。文献[169]研究了变展长飞行器的姿态稳定与精确控制方法,结合改进的自适应预设性能控制(APP)、RBFNN非线性干扰观测器(RBFNDO)和BC,提出基于预设性能的主动抗干扰BC策略。文献[170]针对HMA未知模型动力学、强耦合、时变和参数不确定性问题,提出基于无模型自适应的姿态跟踪控制方法,利用基于宽度学习系统(BLS)的自适应神经网络补偿器,结合误差变换方法和自适应鲁棒积分符号(RISE)反馈控制器,为工程应用提供了有效方案。值得注意的是,上述控制方法大多采用RBFNN,它是一种单隐含层神经网络,具有收敛速度快、逼近能力强的优点。
**2.3. 强化学习控制**
RL控制将RL与控制理论结合,通过智能体与环境的交互学习有效控制策略,不依赖精确控制模型,能处理模型不确定性和未建模动力学,天然适用于变形飞行器控制问题。在RL控制问题中,通常先将控制模型转化为马尔可夫决策过程(MDP),设计状态空间、动作空间、奖励函数和策略函数或价值函数。一种思路是将RL方法与传统控制方法结合,用于联合控制或提供补充控制功能、优化现有控制器设计参数以及切换控制器。文献[169]提出基于深度Q网络(DQN)算法的自适应姿态控制方法,以线性自抗扰控制(LADRC)基本控制器的参数为动作,利用Q网络自主调节不同飞行状态的控制参数。文献[170]提出基于切换非线性系统和RL的预设性能控制方法,基本控制器由反步法设计,补充控制部分由Actor-Critic神经网络结构设计。文献[171]提出基于Q学习的切换控制方法。文献[172]设计了新型仿生变形尾翼,基于无模型控制算法近端策略优化(PPO)控制尾翼。文献[173]以传统控制方法作为操纵舵面和发动机推力的基本控制器,将变形机构视为额外控制输入,设计基于dueling-DQN的智能变形控制器。文献[174]以变展长飞行器为研究对象,将策略网络与传统PD控制结合形成复合控制器,采用双延迟深度确定性策略梯度(TD3)算法优化控制策略。文献[175]提出基于鲁棒深度强化学习(DRL)的制导控制一体化方法,结合TD3算法和固定时间SMC。另一种思路是直接将DRL算法作为生成飞行控制律的数据驱动解决方案。文献[176]设计了PID网络,使用TD3算法训练,采用基于PID的数据增强策略。文献[177]提出基于扩展状态的RL方法,引入三轴转动惯量进入状态空间,采用深度确定性策略梯度(DDPG)算法训练控制器实现变形四旋翼姿态控制。文献[178]针对变后掠四翼飞行器不确定条件下的轨迹跟踪控制问题,提出增量深度确定性策略梯度(IDDPG)算法,设计增量模型并集成长短期记忆(LSTM)单元。文献[179]采用DDPG算法,提出基于DRL的仿生变形无人机俯冲/拉起协同控制策略。文献[180]以高超声速折叠翼飞行器为对象,提出基于DRL的姿态控制方法,采用TD3算法学习控制策略。文献[181]针对高超声速变展长飞行器迎角控制,提出基于DDPG的控制方法,在线辨识舵效系数并加入状态向量。文献[182]利用TD3算法训练神经网络控制律实现变形飞行器一体化位置姿态控制。文献[183]提出凸组合深度强化学习(cc-DRL)飞行控制算法,离线使用PPO训练臂长模式的最优飞行控制律,通过凸组合技术构建在线整体飞行控制方案。此外,利用RL(包括自适应动态规划ADP)求解哈密顿-雅可比-贝尔曼(HJB)方程是新兴研究范式。文献[189]提出基于策略梯度的积分强化学习(IRL)方法解决非仿射变形飞行器系统最优控制问题,采用Actor-Critic架构在线求解HJB方程。文献[190]引入扩展状态观测器(ESO)在IRL框架内求解HJB方程,同时估计和补偿模型不确定性和外部干扰。文献[191]将HMA的协同控制问题转化为约束合作微分博弈(DG),构建包含障碍函数和双曲正切函数的HJB方程,提出基于安全强化学习的自适应合作博弈控制(RL-ACGC)算法。文献[192]提出BC算法与Critic-Actor RL相结合的控制方案,利用改进ESO补偿干扰,在反步步骤中采用Critic网络近似HJB方程解并评估控制性能,Actor网络生成控制指令。
**3. 讨论与展望**
**3.1. 综述总结**
本文主要从模糊控制、神经网络控制和RL控制三个方面回顾了变形飞行器姿态智能控制方法的研究进展。总结出以下几点:(1) 变形飞行器姿态智能控制研究是重要发展趋势和方向。AI技术的快速发展为姿态智能控制提供了新思路,研究已涵盖从低速到高速(包括高超声速)的各种类型变形飞行器。(2) 智能方法与传统控制方法相结合是当前研究的主要思路,83.0%的控制方法采用了这种结合方式,能发挥两者优势,提高控制系统精度和鲁棒性。(3) 基于RL的变形飞行器控制中的奖励函数设计本质上是多目标协调问题。奖励函数从传统单误差驱动演变为多目标综合权衡,包括跟踪误差项、控制能量项、变形平滑性、能耗、终端状态奖励和安全约束惩罚等。(4) 变形飞行器姿态智能控制研究将是一项长期而艰巨的任务。81.1%的研究主要集中于变展长和变后掠飞行器,其他类型研究较少;高速领域研究多停留在数值仿真阶段,低速领域仅有少量实际飞行测试。对模糊控制、神经网络控制和RL控制方法进行了更细粒度分析:模糊控制主要优势在于不依赖精确模型且有成熟稳定性分析理论,但性能受预定义规则库限制;神经网络控制具有强大非线性逼近能力,结合反步法和SMC能有效补偿模型不确定性,但性能依赖于数据质量和实时计算能力;RL控制能在复杂未知环境中学习最优策略,表现出最强长期适应性,但存在样本效率低和训练不稳定等问题,通过结合鲁棒控制、改进状态空间设计或利用RL求解HJB方程等方法可提升性能。
**3.2. 展望**
AI促进了工程领域许多研究和技术发展,但基于AI的研究在变形飞行器控制领域的应用仍相对较少。未来可从以下几个方面拓展:(1) 变形-姿态一体化控制:当前多数研究将两者分开处理,未来需构建一体化控制架构,实现变形机构运动与姿态控制系统的深度融合,减少姿态波动,提高飞行安全性和适应性。目前81.1%的研究采用外部输入变形指令控制,其余一体化控制研究均基于RL方法但尚未成熟。(2) 端到端姿态控制:旨在建立从传感器输入到执行器输出的直接映射,跳过复杂中间建模与控制环节。结合RL与深度学习有望实现端到端控制,但需解决仿真环境与现实世界的差异、训练数据获取困难、模型可解释性差和泛化能力不足等问题。(3) 数据可靠性实施:数据驱动和弱模型依赖方法的性能高度依赖于状态感知的准确性,需研究多类型传感器数据融合方法,利用AI数据融合算法实现准确感知,为姿态智能控制提供坚实数据基础。(4) 模型不确定性处理:多数研究者通过设计模糊干扰观测器和神经网络干扰观测器解决模型不确定性问题,但观测器性能依赖于收敛性且对测量噪声敏感。RL方法无需大量数据预处理,可根据实时反馈动态调整控制参数,自动补偿模型误差,是未来发展必然趋势。(5) 工程应用实施:利用RL求解HJB方程的方法基于最优控制HJB理论,可严格证明算法收敛性和闭环系统渐近稳定性,具有强可解释性,更符合航空航天控制的安全合规要求,有希望工程应用。同时需考虑算法实时性、资源占用、与现有航电系统兼容性等问题,并通过大量地面试验和飞行试验验证。