基于学习的预测控制在涡扇发动机优化及平衡漂移问题中的应用

《Aerospace Science and Technology》：Learning-based Predictive Control for Turbofan Engine Optimization and Equilibrium Drift

【字体：大中小】 时间：2026年03月28日 来源：Aerospace Science and Technology 5.8

编辑推荐：

　　加速/减速优化与平衡漂移抑制在涡轮风扇发动机中的应用研究，提出基于Identify-Actor-Critic框架的学习型预测控制方法，通过引入燃料流量惩罚项和双曲正切函数实现边界优化，解决健康退化导致的平衡漂移问题，仿真显示该方法比传统RL方法快35%，平衡漂移误差<1%。

Xinyu Ren|Ruichao Li|Jiwei Wen|Chenxi Zhang

西北工业大学动力与能源学院，西安，710129，中国

摘要

本文研究了涡扇发动机加速/减速优化和平衡漂移这一关键问题，这一问题由于系统动力学的不确定性以及缺乏可靠的预测模型而变得更加复杂。为了解决这一难题，我们开发了一种基于识别器-演员-评论家（Identifier-Actor-Critic，LPC）框架的预测控制方法。首先，建立了一个双轴混合流涡扇发动机的线性参数变分（LPV）模型来近似发动机非线性并生成实验数据集。基于该数据集，开发了一个识别器神经网络来生成预测数据，从而提高了优化的效率。接下来，在一步成本函数和评论家网络中的Q函数中分别引入了惩罚项和双曲正切函数，以平衡转速调节和燃油效率。在发动机加速或减速的初始阶段，该方法优化了燃油流量，使发动机转速能够快速达到稳态值。第三，基于演员-评论家框架实现了LPC算法，并应用了梯度下降方法。通过交替迭代更新Q函数和控制策略，得到了优化的控制器，稳定了所有输出变量，包括高压和低压转子转速，并解决了平衡漂移问题。最后，仿真结果证明了所提出的LPC方法在动态响应速度方面的显著优势。

引言

涡扇发动机在维持飞行安全方面发挥了重要作用[1]。在各种动态过程中，加速和减速尤为关键[2]、[3]，因为它们具有高度非线性行为、复杂的瞬态响应、时变特性以及平衡漂移问题[4]。这种强烈的非线性对控制器设计构成了根本性挑战，因为它可能导致复杂的瞬态现象，这是现代航空发动机控制系统中的关键问题[5]。这些挑战不仅使发动机控制变得更加复杂，还对鲁棒性和实时性能提出了更高的要求[6]。

传统的涡扇发动机控制通常依赖于预先计算好的燃油调度曲线来管理加速和减速。然而，这种预先设计在变化的操作条件下往往难以平衡响应性和控制精度[7]。为了解决这些问题，引入了模型预测控制（MPC），该方法依赖于已识别的模型，并结合反馈控制来提高动态性能。[8]进行了一系列关于MPC的深入研究。例如，基于离散时间线性化状态空间模型设计了一种多变量MPC用于加速过程[9]，其中遗传算法被用来优化预测和控制范围。Pang等人[10]提出了一个受限MPC框架，以减少推力损失，同时确保转速保持在指定范围内。一些研究人员还结合了来自滤波器的有界不确定性估计来设计鲁棒控制器，以提高对不确定性和噪声的抵抗力[11]、[12]。

值得注意的是，神经网络越来越多地与MPC结合使用，以开发先进的控制策略[13]。例如，针对无人机的不稳定性和高度非线性行为，提出了一种自适应的鲁棒非线性MPC框架[14]。为了进一步提高鲁棒性，作者应用了混合敏感性方法并引入了频率依赖的权重矩阵。另一项研究专注于改进加速性能，开发了一种用于航空发动机直接推力控制的新非线性MPC方法[15]。该方法以推力作为控制目标，而不是依赖于可测量的参数。然而，由于涡扇发动机固有的非线性和时变特性，准确获取系统动力学变得非常具有挑战性[16]。线性或简化模型往往无法捕捉完整的动态范围，因此需要一种能够直接应对或适应非线性行为的控制方法[17]。这些限制限制了MPC方法的实际应用[18]。

近年来，强化学习（RL）作为一种数据驱动的方法出现，在复杂系统的控制中显示出巨大潜力[19]。与基于模型的控制不同，RL可以通过与环境交互来确定最优控制策略，而无需依赖已知的系统动力学[20]。这种能力使RL在飞机发动机控制中具有明显优势，因为非线性和时变动力学仍然是一个重大挑战[21]。多项研究探索了基于RL的发动机加速控制方法。Gao等人[22]使用演员-评论家框架和深度确定性策略梯度算法，通过互补积分器和动量组件提高了整体性能。对于涡扇发动机的全包线加速[23]，提出了一种混合调整方法，结合了粒子群优化和序列二次规划。这种方法在飞行包线内获得了良好的加速性能，并增强了压缩机的稳定裕度。Gu等人提出了一种基于RL的局部滚动时域方法来优化涡扇发动机的加速调度。通过结合基于深度神经网络的在线数据驱动LPV模型，他们提高了加速的准确性和安全性[24]。近年来，在开发无模型、考虑不确定性的演员-评论家类型人工智能方法以实现最优预测和控制方面取得了显著进展。这些方法在处理具有未知动力学和强非线性的系统时特别有效，无需依赖显式的系统模型。例如，最近一项关于强化学习分析最小时间平衡问题的研究表明，此类框架在不确定性和复杂约束条件下实现最优控制的潜力[25]。

在上述RL控制设计中，如何在安全范围内快速稳定转速仍然是一个关键的研究挑战[26]。实际上，保持稳定的转速依赖于燃油流量的闭环控制[1]。过多的燃油流量可能导致涡轮进口温度超过限制，影响涡轮寿命；燃油流量不足可能导致发动机失速[2]。为了解决这一挑战，参考文献[27]、[28]提供了不同的受限控制策略，以确保系统在加速过程中的能量存储阶段在安全范围内运行。然而，如何在加速（或减速）过程中控制燃油供应，以实现转速的快速增加（或减少），在基于RL的控制中仍然是一个未解决的问题[29]。这被称为“边缘优化”。

此外，受到最近跨学科在复杂系统控制领域进展的启发，结合自适应和基于学习的方法对于在重大不确定性和欠驱动条件下运行的系统被证明非常有效[30]、[31]。同时，在加速等瞬态过程中，航空发动机必须严格在物理边界附近运行。为了在这些安全限制内实现最佳性能，结合为高度受限工程问题设计的先进优化算法为航空发动机控制提供了有希望的理论基础[32]、[33]。

此外，涡扇发动机的关键部件不断受到极端条件的影响，包括高温、高压和高转速，导致整体健康状况下降[34]。因此，涡扇发动机的健康管理已成为一个重要课题[35]。当前的健康管理研究主要集中在故障估计上，这在诊断系统异常中起着关键作用[36]、[37]。然而，仅仅估计故障是不够的。如果没有适当的控制，发动机在状况恶化时仍可能发生平衡漂移，导致偏离目标转速[38]。因此，准确描述动力学并根据发动机健康状况的变化有效执行控制策略仍然是一个值得进一步探索的领域[39]。

尽管在涡扇发动机的RL控制方面取得了进展[22]、[23]，但仍存在一个关键的研究空白。现有研究尚未充分解决在实现边缘优化的同时保持对平衡漂移的鲁棒性的挑战。具体来说，[27]、[28]中提出的工作缺乏明确强制边缘优化的控制设计，以获得最佳瞬态性能，并结合补偿来抵消稳态偏移。

尽管现有研究在涡扇发动机控制方面取得了一些进展，但大多数方法在应对平衡点漂移和边缘优化等挑战时仍存在某些局限性。为了弥合这一差距，本研究研究了无模型双轴混合流涡扇发动机的加速和减速优化以及对平衡漂移的适应性。通过结合识别器-演员-评论家框架，开发了一种基于学习的预测控制（LPC）方法来实现边缘优化和平衡漂移抑制。与现有研究相比，本工作的关键贡献总结如下：

• 在一步成本函数和评论家中分别引入了惩罚项和双曲正切函数，以实现燃油输入的边缘优化，使转速在初始加速或减速阶段以最快的速度增加或减少。

• 通过使用识别器-演员-评论家网络框架开发了LPC方法。识别器神经网络生成预测数据，丰富了数据集并提高了学习效率。演员-评论家网络应用梯度下降算法来优化控制策略。最终，它成功稳定了七个关键输出变量，包括高压和低压转子转速，同时解决了平衡漂移问题。

为了解决现有涡扇发动机控制策略的局限性，本研究旨在开发一种基于识别器-演员-评论家的LPC框架，能够在加速和减速过程中实现不超过1.10秒的上升时间，同时在健康状况下降时消除平衡漂移，确保燃油效率和安全性约束。

现有的基于RL的方法表现出较慢的瞬态响应（大约1.70秒的上升时间），而无边缘优化的LPC虽然更快（1.30秒），但在退化条件下无法抑制平衡漂移。为了克服这些缺点，所提出的LPC结合了在线优化结构来补偿健康引起的模型不匹配，并应用了边缘优化，设置了一个定量阈值，允许燃油流量在加速期间达到其稳态值的120%，以在安全限制内最大化上升速率。因此，控制器实现了大约1.10秒的上升时间，与无边缘优化的LPC相比减少了约15%，与RL相比减少了35%。此外，即使当降至0.99和0.98时，平衡漂移也减少到目标值的1%以内。

部分摘录

涡扇发动机的LPV模型

涡扇发动机是一种复杂的热机械系统，旨在通过燃油燃烧将化学能转换为机械能，从而为飞机产生推力。其结构如图1所示。本文的研究重点是一种双轴混合排气涡扇发动机，它由进气口、压缩机、燃烧室、涡轮和喷嘴等组成。其动态行为受到操作条件参数（如飞行）变化的极大影响

基于学习的预测控制

尽管可以通过符号计算建立LPV模型（1），但由于涡扇发动机复杂的空气动力学特性，准确确定其参数仍然具有挑战性。因此，开发了一个基于学习的预测控制框架来解决这一限制。下面将详细介绍为实现这一目标的识别器-演员-评论家结构。

仿真

本节旨在验证LPC方法的控制性能，评估其有效性。为了全面了解该方法的优点和局限性，进一步进行了比较仿真。这些仿真包括原始的LPC技术、无边缘优化的LPC（称为无边缘LPC）和RL方法。这些比较的重点是评估每种方法在相同条件下的表现，特别是在

结论

本文通过基于识别器-演员-评论家结构开发LPC设计框架，解决了涡扇发动机的加速-减速和平衡漂移问题。研究和仿真结果表明，LPC在控制涡扇发动机的加速和减速过程中表现出优势，并在非线性控制和平衡漂移方面表现出有效性能。LPC的上升时间比基准快

15 ? 35 %

CRediT作者贡献声明

Xinyu Ren：写作 – 审稿与编辑，撰写原始草稿，可视化，软件，方法论。Ruichao Li：验证，监督，调查，资金获取，形式分析，概念化。Jiwei Wen：写作 – 审稿与编辑，验证，项目管理，方法论，调查，资金获取。Chenxi Zhang：可视化，验证，软件，资源，数据管理。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

摘要

引言

部分摘录

涡扇发动机的LPV模型

基于学习的预测控制

仿真

结论

CRediT作者贡献声明

利益冲突声明

热点排行