涡扇发动机在维持飞行安全方面发挥了重要作用[1]。在各种动态过程中,加速和减速尤为关键[2]、[3],因为它们具有高度非线性行为、复杂的瞬态响应、时变特性以及平衡漂移问题[4]。这种强烈的非线性对控制器设计构成了根本性挑战,因为它可能导致复杂的瞬态现象,这是现代航空发动机控制系统中的关键问题[5]。这些挑战不仅使发动机控制变得更加复杂,还对鲁棒性和实时性能提出了更高的要求[6]。
传统的涡扇发动机控制通常依赖于预先计算好的燃油调度曲线来管理加速和减速。然而,这种预先设计在变化的操作条件下往往难以平衡响应性和控制精度[7]。为了解决这些问题,引入了模型预测控制(MPC),该方法依赖于已识别的模型,并结合反馈控制来提高动态性能。[8]进行了一系列关于MPC的深入研究。例如,基于离散时间线性化状态空间模型设计了一种多变量MPC用于加速过程[9],其中遗传算法被用来优化预测和控制范围。Pang等人[10]提出了一个受限MPC框架,以减少推力损失,同时确保转速保持在指定范围内。一些研究人员还结合了来自滤波器的有界不确定性估计来设计鲁棒控制器,以提高对不确定性和噪声的抵抗力[11]、[12]。
值得注意的是,神经网络越来越多地与MPC结合使用,以开发先进的控制策略[13]。例如,针对无人机的不稳定性和高度非线性行为,提出了一种自适应的鲁棒非线性MPC框架[14]。为了进一步提高鲁棒性,作者应用了混合敏感性方法并引入了频率依赖的权重矩阵。另一项研究专注于改进加速性能,开发了一种用于航空发动机直接推力控制的新非线性MPC方法[15]。该方法以推力作为控制目标,而不是依赖于可测量的参数。然而,由于涡扇发动机固有的非线性和时变特性,准确获取系统动力学变得非常具有挑战性[16]。线性或简化模型往往无法捕捉完整的动态范围,因此需要一种能够直接应对或适应非线性行为的控制方法[17]。这些限制限制了MPC方法的实际应用[18]。
近年来,强化学习(RL)作为一种数据驱动的方法出现,在复杂系统的控制中显示出巨大潜力[19]。与基于模型的控制不同,RL可以通过与环境交互来确定最优控制策略,而无需依赖已知的系统动力学[20]。这种能力使RL在飞机发动机控制中具有明显优势,因为非线性和时变动力学仍然是一个重大挑战[21]。多项研究探索了基于RL的发动机加速控制方法。Gao等人[22]使用演员-评论家框架和深度确定性策略梯度算法,通过互补积分器和动量组件提高了整体性能。对于涡扇发动机的全包线加速[23],提出了一种混合调整方法,结合了粒子群优化和序列二次规划。这种方法在飞行包线内获得了良好的加速性能,并增强了压缩机的稳定裕度。Gu等人提出了一种基于RL的局部滚动时域方法来优化涡扇发动机的加速调度。通过结合基于深度神经网络的在线数据驱动LPV模型,他们提高了加速的准确性和安全性[24]。近年来,在开发无模型、考虑不确定性的演员-评论家类型人工智能方法以实现最优预测和控制方面取得了显著进展。这些方法在处理具有未知动力学和强非线性的系统时特别有效,无需依赖显式的系统模型。例如,最近一项关于强化学习分析最小时间平衡问题的研究表明,此类框架在不确定性和复杂约束条件下实现最优控制的潜力[25]。
在上述RL控制设计中,如何在安全范围内快速稳定转速仍然是一个关键的研究挑战[26]。实际上,保持稳定的转速依赖于燃油流量的闭环控制[1]。过多的燃油流量可能导致涡轮进口温度超过限制,影响涡轮寿命;燃油流量不足可能导致发动机失速[2]。为了解决这一挑战,参考文献[27]、[28]提供了不同的受限控制策略,以确保系统在加速过程中的能量存储阶段在安全范围内运行。然而,如何在加速(或减速)过程中控制燃油供应,以实现转速的快速增加(或减少),在基于RL的控制中仍然是一个未解决的问题[29]。这被称为“边缘优化”。
此外,受到最近跨学科在复杂系统控制领域进展的启发,结合自适应和基于学习的方法对于在重大不确定性和欠驱动条件下运行的系统被证明非常有效[30]、[31]。同时,在加速等瞬态过程中,航空发动机必须严格在物理边界附近运行。为了在这些安全限制内实现最佳性能,结合为高度受限工程问题设计的先进优化算法为航空发动机控制提供了有希望的理论基础[32]、[33]。
此外,涡扇发动机的关键部件不断受到极端条件的影响,包括高温、高压和高转速,导致整体健康状况下降[34]。因此,涡扇发动机的健康管理已成为一个重要课题[35]。当前的健康管理研究主要集中在故障估计上,这在诊断系统异常中起着关键作用[36]、[37]。然而,仅仅估计故障是不够的。如果没有适当的控制,发动机在状况恶化时仍可能发生平衡漂移,导致偏离目标转速[38]。因此,准确描述动力学并根据发动机健康状况的变化有效执行控制策略仍然是一个值得进一步探索的领域[39]。
尽管在涡扇发动机的RL控制方面取得了进展[22]、[23],但仍存在一个关键的研究空白。现有研究尚未充分解决在实现边缘优化的同时保持对平衡漂移的鲁棒性的挑战。具体来说,[27]、[28]中提出的工作缺乏明确强制边缘优化的控制设计,以获得最佳瞬态性能,并结合补偿来抵消稳态偏移。
尽管现有研究在涡扇发动机控制方面取得了一些进展,但大多数方法在应对平衡点漂移和边缘优化等挑战时仍存在某些局限性。为了弥合这一差距,本研究研究了无模型双轴混合流涡扇发动机的加速和减速优化以及对平衡漂移的适应性。通过结合识别器-演员-评论家框架,开发了一种基于学习的预测控制(LPC)方法来实现边缘优化和平衡漂移抑制。与现有研究相比,本工作的关键贡献总结如下:
• 在一步成本函数和评论家中分别引入了惩罚项和双曲正切函数,以实现燃油输入的边缘优化,使转速在初始加速或减速阶段以最快的速度增加或减少。
• 通过使用识别器-演员-评论家网络框架开发了LPC方法。识别器神经网络生成预测数据,丰富了数据集并提高了学习效率。演员-评论家网络应用梯度下降算法来优化控制策略。最终,它成功稳定了七个关键输出变量,包括高压和低压转子转速,同时解决了平衡漂移问题。
为了解决现有涡扇发动机控制策略的局限性,本研究旨在开发一种基于识别器-演员-评论家的LPC框架,能够在加速和减速过程中实现不超过1.10秒的上升时间,同时在健康状况下降时消除平衡漂移,确保燃油效率和安全性约束。
现有的基于RL的方法表现出较慢的瞬态响应(大约1.70秒的上升时间),而无边缘优化的LPC虽然更快(1.30秒),但在退化条件下无法抑制平衡漂移。为了克服这些缺点,所提出的LPC结合了在线优化结构来补偿健康引起的模型不匹配,并应用了边缘优化,设置了一个定量阈值,允许燃油流量在加速期间达到其稳态值的120%,以在安全限制内最大化上升速率。因此,控制器实现了大约1.10秒的上升时间,与无边缘优化的LPC相比减少了约15%,与RL相比减少了35%。此外,即使当降至0.99和0.98时,平衡漂移也减少到目标值的1%以内。