物理学-拓扑学为基础的学习方法:一种在数据稀缺条件下用于时间序列预测和异常检测的强大且轻量级的框架 华轩浩(Xuanhao Hua), 尹伟琪(Weiqi Yin), 王丽斌(Libin Wang), 马萌(Meng Ma), 袁建峰(Jianfeng Yuan), 张静(Jing Zhang)

《Sensors》:Physics-Topology-Anchored Learning: A Robust and Lightweight Framework for Time-Series Prediction and Anomaly Detection Under Data Scarcity Xuanhao Hua, Weiqi Yin, Libin Wang, Meng Ma, Jianfeng Yuan and Jing Zhang

【字体: 时间:2026年03月10日 来源:Sensors 3.5

编辑推荐:

  摘要 复杂系统的健康监控对于确保可靠性并实现成本效益高的可重复使用性至关重要。然而,在这一领域部署深度学习模型受到两个主要限制的阻碍:高质量故障样本的稀缺性和机载计算资源的限制。为了解决这些挑战,本文提出了一种基于物理拓扑的学习(PTAL)框架。其核心创新

  摘要 复杂系统的健康监控对于确保可靠性并实现成本效益高的可重复使用性至关重要。然而,在这一领域部署深度学习模型受到两个主要限制的阻碍:高质量故障样本的稀缺性和机载计算资源的限制。为了解决这些挑战,本文提出了一种基于物理拓扑的学习(PTAL)框架。其核心创新在于将物理归纳偏见有效地整合到模型架构中。具体来说,PTAL结合了一个从物理机制中得出的预定义邻接矩阵作为结构先验。这种设计将神经网络与明确的物理因果关系联系起来,有效地限制了假设空间,并减少了模型对大规模数据的依赖。此外,通过将这种基于物理的结构与轻量级的循环注意力机制相结合,模型避免了通用大规模网络通常面临的高计算开销。实验评估表明,PTAL的诊断准确率达到了97.8%,标准差仅为0.1145,在数据稀缺的情况下显著优于基线模型。结果证实,所提出的模型成功地利用了物理偏见,在诊断性能和计算效率之间取得了良好的平衡,使其非常适合资源受限的复杂系统环境。

1. 引言
如今,随着太空开发与我们未来生活的紧密联系,可重复使用的液体火箭发动机成为未来的趋势。全球正在付出巨大努力来开发RLRE(可重复使用液体火箭发动机),这带来了新的挑战。在健康监控系统(HMS)技术领域,可以在不进行每次发射都重新验证测试的情况下实现功能可靠性和成本降低[1]。与传统的一次性LRE相比,RLRE最具吸引力的特点是价格大幅降低[2]。因此,需要提高RLRE的可靠性和安全性,以避免灾难性事故的发生。除了在设计和制造阶段提高可靠性外,还需要开发一种容错系统,这意味着发动机能够在飞行过程中智能地检测到故障并立即安全停止[3]。这一过程通常是通过开发先进的HMS技术来实现的。随着运载火箭可重复使用的商业化,随着系统老化,HMS变得越来越重要[4]。
在任务保障过程中,从整个车辆系统收集的遥测数据在发射前、发射和返回阶段持续被监控,这需要数千个传感器的支持[5]。为了实时检测任务过程中的即将发生或潜在的故障,传统的HMS技术依赖于红线截止系统,该方法通过比较红线限制和历史数据来计算[6]。然而,这种方法依赖于历史数据,忽略了不同发动机之间的差异。因此,需要开发先进的异常检测和故障隔离算法。
发动机故障检测和隔离的方法分为三类:基于规则的方法、基于模型的方法和数据驱动的方法[7]。基于规则的方法根据从有经验的工程师和大量的历史热试车测试数据以及系统故障模拟结果中收集的规则进行故障诊断[8]。基于规则的方法需要对已知的系统故障模式有丰富的经验,这在处理新行为时存在困难,并且随着系统复杂性的增加而变得难以管理[9]。基于模型的方法利用复杂系统中的物理定律来建立输入参数和输出性能之间的关系[10]。其优势在于可以通过已知的科学原理进行解释。通过提供一个关于基本物理关系的基线模型,可以通过过滤算法确定参数。例如,在[11]中进行了针对目标系统的多物理系统级建模和仿真,采用了多种不同物理领域和组件的故障诊断。然而,由于物理过程的固有复杂性,构建准确的模型具有挑战性[12]。虽然基于规则和基于模型的方法提供了高解释性,但它们依赖于详尽的专家知识或完美的物理方程式,在面对RLRE启动瞬态的高频动态和非线性耦合时显得脆弱。数据驱动的方法利用监控数据通过机器学习算法或统计模型来检测和隔离潜在故障,这可以弥补基于模型的方法的不足,后者依赖于对系统的先验知识[13]。由于数据驱动的方法仅依赖于监控数据而不需要理解系统的物理模型,因此受到了更多关注。
由于深度学习算法的最新突破,机器学习方法在故障诊断领域得到了广泛研究[14]。例如,Park等人[15]提出了一种基于CNNLSTM的故障诊断方法,并进行了数值仿真案例研究以展示其性能。结果表明,与传统的红线截止系统相比,它可以提高分类准确性。Li等人[16]结合了软目标差异缩放和度量学习来计算发动机状态区分阈值。使用从液体火箭发动机收集的测量数据来验证其性能。Zhu等人[17]提出了一种基于卷积自编码器和一类支持向量机的故障检测方法,用于LRE的稳态过程。实验结果表明,与传统红线系统、自适应阈值算法和反向传播神经网络相比,该方法具有优势。然而,这些数据驱动方法存在明显的缺点:CNN-LSTM模型缺乏物理基础,在数据稀缺时容易出现过拟合;度量学习方法忽略了发动机组件的结构连接性;自编码器方法主要针对稳态过程进行了优化,而不是针对启动瞬态的复杂因果关系。
总体而言,数据驱动和基于模型的方法都有各自的特性,在应用于复杂工程问题的故障诊断时可能会遇到某些不足[18]。然而,在RLRE的特定领域,挑战更加突出。尽管先进的深度学习模型(如Transformers)在一般领域取得了显著成功,但它们在RLRE健康监控中的部署受到两个主要限制的严重阻碍:高质量故障样本的固有稀缺性和机载计算资源的限制。当训练数据有限时,通用的大规模模型经常会出现过拟合,并且会带来超出边缘设备处理能力的计算负担。
为了解决这些挑战,越来越多的人认为解决方案需要将物理归纳偏见与轻量级深度学习架构有效结合的新范式[19]。在这项研究中,提出了一种基于物理拓扑的学习(PTAL)框架。与试图从零开始学习潜在关系的纯数据驱动方法不同,PTAL利用发动机的数值机制来构建一个预定义的物理邻接矩阵作为结构先验。这种设计将学习过程与明确的物理因果关系联系起来。此外,我们采用轻量级的循环层来模拟流体动力学的时态惯性,结合了专注的注意力机制进行特征加权。通过这种方式,模型高效地提取了时空特征,保持了诊断性能和模型复杂性之间的平衡,非常适合RLRE。
本文的主要贡献如下:
i. 我们提出了一个专门为数据稀缺情况下RLRE的稳健故障诊断设计的新型框架。通过将内在的组件连接性和流体路径编码为模型的“硬”结构约束(即物理归纳偏见),PTAL减少了假设空间。这种“锚定”效应显著增强了模型的鲁棒性和泛化能力,与纯数据驱动的“黑盒”方法相比。
ii. 为了克服在航空航天边缘设备上部署深度学习的计算瓶颈,我们设计了一种轻量级的循环图架构。我们不是从数据中学习密集的邻接矩阵,也不是使用庞大的Transformer模块,而是通过系统的物理机制确定关系图,并通过高效的循环单元捕获序列特征。这种设计避免了大规模模型的高参数冗余,确保了操作效率。
iii. 通过广泛的仿真和真实世界实验验证了所提出的PTAL方法的性能。结果表明,即使在少量样本的情况下,该模型也能实现具有竞争力的诊断准确性,并在准确性和计算成本之间保持了良好的平衡,证明了其在实际资源受限的RLRE健康监控任务中的潜力。
本文的其余部分组织如下。第2节介绍了所提出的故障诊断框架。第3节利用仿真和实际监控数据展示了所提方法的性能。第4节将我们的方法与其他方法进行了比较。最后,在第5节得出了一些重要的结论。

2. 方法论
本研究旨在实现两个主要目标,专门针对复杂工程系统(如RLRE)的健康监控。第一个目标是通过直接将物理归纳偏见嵌入学习过程中来有效缓解数据稀缺的挑战。具体来说,我们寻求用确定性的物理拓扑锚定方法替代数据密集型的关联学习。同时,我们旨在建立一个轻量级且可解释的诊断模块,全面捕捉系统的时态动态和组件之间的空间因果关系。这种双重关注确保了即使在资源受限的平台上也能保持稳健的性能和操作效率。
2.1. 架构
所提出的基于物理拓扑的学习(PTAL)框架的总体架构如图1所示,采用了一种专门的物理信息编码器-解码器结构,旨在将多维传感器数据映射到物理意义上的潜在空间。物理锚定编码器作为核心组件,利用图卷积网络(GCN)和长短期记忆(LSTM)单元的混合架构来提取时空特征。在空间建模(拓扑锚定)方面,GCN层受到预定义物理邻接矩阵的约束,而不是从零开始学习完全连接的图。该矩阵编码了组件之间的内在连接性,有效地迫使模型仅沿物理因果路径聚合信息。同时,LSTM单元捕获监控参数的动态演变和时态依赖性。随后,受物理约束的GCN和时态LSTM的输出被融合成一个紧凑的潜在状态,该状态封装了系统的健康状态,同时过滤掉了无关噪声。之后,诊断解码器解释潜在特征以完成最终的诊断任务。解码器包括相应的LSTM层和全连接(FC)层,将带有物理拓扑信息的高级表示映射到目标输出空间,生成最终的故障分类结果。
2.2. 关于数据集和先验知识
实验数据来自液体火箭发动机的高保真物理仿真,捕捉了正常点火和三种不同故障模式下的启动瞬态阶段。从原始的28个监控变量(不包括时间戳)中,基于它们的物理重要性选择了10个关键特征用于模型训练。这些特征包括主燃烧室压力(Pc)、主燃烧室温度(Tc)、燃料预燃烧室压力(fpbPc)、低压燃料涡轮泵出口压力(lpftpPo)、低压燃料涡轮泵速度(lpftpN)、低压燃料涡轮泵流量(lpftpQ)、高压氧化剂涡轮泵出口压力(hpftPo)、高压氧化剂涡轮泵速度(hpftpN)、高压氧化剂涡轮泵流量(hpftpQ)和喷嘴喉部冷却液压力(ncP)。此外,通过物理机制分析建立了这些参数之间的因果关系,并将其作为结构先验知识。所得到的物理邻接矩阵如表1所示。
2.3. 长短期记忆用于时序依赖性
RNN在自然语言处理[20,21]和时间序列预测[22,23]等领域得到了广泛应用,因为它们具有独特的数据传播结构和处理序列数据中时序依赖性的卓越能力。长短期记忆(LSTM)是一种专门的循环神经网络变体,在捕捉和编码时间序列数据中的长距离依赖性方面表现出色[24]。因此,在本研究中,我们使用LSTM来建模和捕获数据中的时序依赖性。
考虑到所使用数据集的特点,它由时间序列数据组成,每个样本点包含同一时间点的不同传感器变量。整个网络沿着时间轴传播数据。因此,我们使用LSTM来处理时序依赖性,因为所有数据点都分布在时间轴上。每个数据点代表了同一时间步骤中所有特征的数值。LSTM时间步长??的通用计算流程如下。如图2所示,通过LSTM层捕获发动机启动瞬态的时间特征。在计算方程(1)–(3)之后,当前时间步长的LSTM单元获得两个输出向量????和???,并将它们传递给下一个时间步长的LSTM单元。

?? ? ? ??????????????????? ? ? ??=?? ? ? ?????????????????? ? ? ??·[????1????]+?? ? ? ?????????????????? ? ? ?? (1)
????=?????????????????????(????)????????1+?????????????????????(????)????????????????????????(??) (2)
???=?????????????????????(????)???tan h?(????) (3)

LSTM通过输入门、遗忘门和输出门进行内部计算和数据传播。Sigmoid函数允许LSTM单元选择性地记住和遗忘中间数据。总之,LSTM单元编码多维时间序列数据,提取时间依赖性,并在多传感器故障检测问题中找到广泛的应用。

2.4 图神经网络(Graph Neural Network)
2.4.1 物理嵌入图(Physics-Embedded Graph)
图由一组有限的非空顶点和顶点之间的边组成[25]。GNN的典型输入包括两个主要组成部分:图结构和节点标签。根据上述背景,图的结构将以邻接矩阵的形式输入到模型中用于学习或迭代。由于图网络在捕获数据中的空间相关性方面表现出色,我们将每个传感器通道视为一个图节点,因此在每个时间步长,每个传感器可以表示图网络中的一个节点。鉴于本研究中的实验数据包含液体火箭发动机启动的瞬态数据,传感器序列之间存在明显的图关系。因此,在这项研究中,图3中描绘的图结构是根据表1中呈现的数据进行定性定义的。具体来说,图结构代表了实际的物理模型[26],即一个物理嵌入图。

2.4.2 图卷积网络(Graph Convolutional Network, GCN)
GCN的概念最早由Thomas Kipf等人在[27]中提出。图数据在诸如社交网络、推荐系统、生物信息学、知识图谱等各个领域广泛存在。这些数据集通常具有复杂的拓扑结构和节点之间的关系,使得传统的机器学习方法在处理它们时往往效果不佳。因此,需要开发新的深度学习模型来处理这种非结构化的图数据。同时,CNN在计算机视觉领域取得了巨大成功,有效地捕获了图像中的局部特征和空间关系。鉴于图也具有局部性和空间结构(以节点之间的关系形式存在),研究人员开始探索将CNN原理应用于图数据以增强其建模能力[28]。GCN的引入填补了图数据建模的空白,并为处理图数据提供了一个强大的深度学习框架[29]。它通过将卷积操作应用于图数据来实现这一点,使模型能够促进节点之间的信息传播,从而学习节点表示及其之间的关系。与前一节不同,我们不再强加预定义的图结构,这意味着我们不会提供任何邻接矩阵或内部关系。相反,在这项研究中,这些关系将由GCN本身学习,旨在揭示各种传感器通道之间潜在的、未被注意到的连接。

图学习层的公式如下:
??1=tan h?(??????????????????????????1?(????????)?Θ1) (4)
??2=tan h?(??????????????????????????1?(????????)?Θ2) (5)
??=ReLU?(tan h?(??1???2??)) (6)
其中,嵌入表示将标量索引向量转换为嵌入矩阵的两个不同的随机初始化层。在这个上下文中,方程中的变量idx表示节点索引,它们是表示节点标识符的正整数。由于嵌入层是可训练的,随着模型的迭代,邻接矩阵也会发生变化,这表明该模型可用于学习图结构。Θ1和Θ2是两个简单前馈神经网络的模型参数。

本质上,最终的学习目标和输出形式是图中每个节点的隐藏向量表示。图卷积模块旨在结合节点的信息及其邻居的信息来处理图中的空间依赖性。换句话说,节点表示是通过转换邻居节点的表示来创建的。不同节点的当前特征反映在隐藏层H中,具体维度由网络的构建决定。目标节点的下一阶段特征向量是根据其当前特征及其邻居的特征计算得出的。一般来说,图卷积网络同时计算所有节点的特征。然而,在进入第一个图卷积层之前,通常需要为每个节点提供初始特征。在这个例子中,初始特征是从不同变量的时间序列数据中提取的。

2.5 提出的PTAL-Attention架构(Proposed PTAL-Attention Architecture)
注意力模型在深度学习的各个领域得到了广泛采用,在图像处理、语音识别和自然语言处理的各种任务中都表现突出。在[31]中,Mnih等人提出了将注意力机制与RNN模型结合用于图像分类,取得了令人印象深刻的性能结果,从而引起了人们对注意力机制的兴趣。注意力机制已广泛应用于基于RNN模型的各种深度学习任务[32]。

注意力机制认为网络中的不同特征具有不同的重要性,后期层更关注关键信息,同时抑制不太重要的细节[33]。注意力的基本组成部分包括三个部分:查询(query)、键(key)和值(value)。通常,一旦定义了这三个组成部分,注意力的计算就变得直接了。图5说明了注意力的概念。在每次注意力计算中,通常有一个查询和多对键和值。在方程(10)中,查询首先通过将其与评分函数一起输入来获取当前键的得分,然后使用SoftMax函数将得分转换为概率权重。注意力机制中有各种评分函数选项,包括加法[34]、点积[35]、缩放点积[36]等。这里,我们以自注意力(self-attention)为例[37]。

最终注意力值由原始值和评分函数的加权和决定,如方程(11)和(12)所示。
??1???=?????????????????????(??1???????√????) (10)
???????????????????????????(??1,??,??)=∑??????=1??1???????? (11)
???????????????????????????(??,??,??)=?????????????????????(??3????√????)??? (12)

设??的维度为?? ×??,其中??是源时间序列数据的长度;键(??)的维度为?? ×??,其中??是目标时间序列数据的长度,??表示向量维度。显然,向量??和??的长度相等,因为它们在相同的向量空间中操作并且需要相似性比较,即????? =????? =??。然而,??的维度为?? ×?????,其向量长度可以与??和??不同。可以将??和??的键值对视为在不同状态空间中表示相同的数据。因此,最终的注意力值形成一个?? ×?????矩阵。应用Softmax加权后,得到权重系数,并根据这些系数在?????维度上进行加权求和,得到??个注意力值,每个值的维度为?????。值得注意的是,公式中引入了一个缩放因子,主要是为了规范化的目的。这有助于分离Softmax分布的陡峭度,确保训练期间的梯度稳定性。

因此,通过采用上述方法,只要注意力机制的元素在LSTM和GNN中定义,就可以轻松地将注意力机制应用于这两个网络。虽然LSTM在解决梯度消失问题和捕获数据中的长期依赖性方面比普通的循环神经网络表现得更好,但在编码过程中信息损失仍然是一个重大挑战,主要是由于遗忘门的存在。在图6中,引入注意力机制使模型能够自动关注时间序列的关键部分,同时忽略不太重要的方面。这增强了模型的注意力焦点,使其能够更好地捕获任务的有意义信息。此外,它还有助于我们理解模型决策的基础。

2.6 计算复杂性分析
本小节从空间(图操作)和时间(序列建模)两个角度分析PTAL的计算效率。表2总结了关键组件的计算复杂性,提供了PTAL与其他主流架构之间的定量比较。因此,空间聚类仅沿着物理连接进行,导致 ???(??) 复杂度,其中 ?? 是物理边缘的数量。由于 RLRE 监控系统通常是稀疏的(?? <
时间复杂度(序列建模)。Transformer 风格的自注意力通常与滑动窗口长度 ?? 相关,其复杂度为 ??2(??2),对于长窗口来说可能会变得非常昂贵。PTAL 使用一个具有聚焦注意力加权机制的循环时间主干网络,其每个窗口的计算量大约为 ??2(??)。这种设计保持了时间建模成本与窗口长度成线性关系,同时保留了强调信息特征的能力。

3. 实验
3.1. 数据处理
如图 8 所示,为了使原始传感器信号与 PTAL 框架的输入要求对齐,我们对时间和空间维度进行了严格的数据处理。
3.1.1. 时间分割(滑动窗口)
由于 LSTM 需要沿着时间维度处理数据,我们采用了滑动窗口机制 [38,39] 来划分数据,如图 8 中的红色虚线框所示。这里的移动步长表示窗口在每一步移动的距离,由图中的黑色虚线表示。这种方法使我们能够获得多组 LSTM 样本数据,其维度为 [时间步长,传感器数量]。通过调整移动步长,我们可以控制获得的样本总数。最后,所有处理过的时间步长数据被调整为 [批次,时间步长,特征] 的三维张量,并输入到 LSTM 网络中。
3.1.2. 空间特征对齐
对于空间组件,图拓扑由第 2.3 节描述的物理邻接矩阵明确定义。为了确保时空一致性,节点特征的定义必须严格与时间段对齐。我们使用从滑动窗口获得的数据段来构建图神经网络(GNN)的输入。具体来说,在窗口内的任何给定时间步长,传感器值向量作为图中对应节点的属性集。这种统一的采样策略确保了时间(LSTM)和空间(GNN)模块处理同步的信息,有效平衡了特征提取焦点在系统动力学和拓扑依赖性之间的平衡。

3.2. 实验设置
3.2.1. 数据集设置和评估标准
本研究中的数据集被分割成不同的时间段。总共有大约 400 个样本,每个样本的维度为 (29, 20,000)。数据集被分为 70% 的训练集和 30% 的验证集。
为了评估预测性能,我们使用准确率作为主要指标,并额外报告宏平均精度(Macro-P)、召回率(Macro-R)和 F1 分数(Macro-F1),以更好地反映多类诊断设置中的误报和漏检情况。所有结果均来自 10 次独立运行,每次运行使用不同的随机种子,并以平均值 ± 标准差的形式报告。对于 Transformer 系列的基线模型,我们遵循统一且公平的协议:所有模型使用相同的输入窗口长度和相同的训练/验证/测试划分,并使用相同的优化器设置和提前停止策略,除非另有说明。为了证实轻量级的主张,我们进一步报告了每个输入窗口的可训练参数数量(Params)和浮点运算次数(FLOPs/window),并在第 4.4 节总结了性能-复杂度权衡。

3.2.2. 超参数
在训练过程中,我们使用 Adam 优化器 [40] 来调整学习率并平滑梯度更新方向,所采用的损失函数是 PyTorch 2.4 中的 CrossEntropy 损失函数进行梯度下降。初始学习率设置为 0.001,权重衰减为 0.0001。为了减少数据处理 [41] 的计算时间,滑动窗口的大小被固定为与单个故障周期的持续时间相匹配。这种结构设计确保模型专注于在单个处理窗口内捕获故障事件的完整演变。

3.3. 基线模型和比较策略
为了严格量化所提出的 PTAL 框架中每个组件的贡献——即时间注意力、空间拓扑和物理锚定——我们对三种现有的编码器-解码器架构 [42] 进行了比较研究。这些基线的选择理由和结构特性如下:
LSTM-LSTM&FC 模型:作为基础基线,该模型采用了经典的序列到序列结构,如图 9 所示。它包括一个 LSTM 层用于编码时间特征,以及一个相应的 LSTM 层和两个全连接(FC)层用于解码。
LSTM 加上注意力机制的 LSTM&FC 模型:为了评估时间焦点的影响,该基线在标准 LSTM-ED 中增加了时间注意力机制,如图 10 所示。该机制为输入序列中的不同时间步长分配动态权重。
LSTM&GAT-LSTM&FC 模型:为了在不考虑物理约束的情况下结合空间依赖性,该模型将图注意力网络(GAT)层集成到编码器中,替换了我们提出的方法中的物理锚定图层(见图 11)。与 PTAL 不同,该模型尝试仅从训练数据中学习图结构和边权重。

4. 结果和讨论
4.1. 通过时间注意力验证物理一致性
在安全关键的航空航天应用中,仅具有高准确率的“黑盒”模型是不够的;它还必须证明其决策逻辑与物理机制一致。为了验证这种物理一致性,我们分析了 PTAL 框架学习到的时间注意力权重。这项分析旨在确认模型的高诊断准确率是基于捕获有效的故障特征,而不是过度拟合瞬态启动噪声。
图 12 展示了单个故障周期内这些注意力权重在时间轴上的分布。为了确保统计显著性,权重在多个测试样本上进行了平均,并在 1000 步间隔上进行了平滑处理。如图所示,初始阶段(0~8 秒)的注意力权重保持在接近零的水平,基线约为 0.025。从物理上讲,这个时期对应于推进剂填充和点火瞬态,这个阶段的特点是高频液压冲击和燃烧不稳定性。重要的是要注意,模型并没有被明确编程来忽略这个数据段。相反,通过物理锚定的学习过程,网络自主确定了这个高熵区间内的特征梯度对区分故障模式没有有效的贡献。这种现象证明了模型对于瞬态干扰的固有鲁棒性,确保了诊断决策不受发动机启动过程中固有的随机性的影响。
随后,在 ?? =8 秒后发生了一个明显的转变,注意力权重在 15~20 秒区间内呈现急剧上升趋势,峰值超过 0.150(增加了 6 倍)。这种转变与 RLRE 的热力学稳定点和真实故障注入时间戳完全一致。权重分布与物理状态之间的对应关系表明 PTAL 成功学会了识别故障表现边界——即传感器参数的累积偏差从正常基线中分离出来的关键时刻。因此,时间注意力分布作为有效性检查,确认了模型与发动机物理操作时间线的动态对齐。通过在故障信号的信噪比(SNR)变得显著时才集中计算资源,所提出的框架验证了其在实际机载部署中的可靠性。

4.2. 总体诊断结果
表 3 中呈现的统计结果表明,与仅考虑时间的基线相比,结合空间依赖性建模改善了多类诊断,因为基于图的方法(LSTM-GAT 和 PTAL)始终优于没有显式拓扑的基于 LSTM 的编码器。在所有比较的方法中,Transformer 系列的基线取得了强劲的性能,FEDFormer 的准确率最高。值得注意的是,PTAL 在 10 次运行中表现出最低的标准差,表明在数据稀缺的训练条件下具有更好的鲁棒性。结合第 4.4 节中的效率分析,这些结果支持物理拓扑锚定能够实现有利的性能-复杂度权衡,而不依赖于复杂的架构。

4.3. 空间可解释结果
本节分析了模型捕获的空间依赖性,以验证学习到的相关性是否与 RLRE 的物理机制一致。
4.3.1. LSTM&GAT-LSTM&FC 模型的结果
LSTM-GAT 基线尝试从数据中自动学习图结构,而不考虑物理约束。表 4 展示了该模型学到的边权重。结果表明,特定的节点对(如 B–C、E–D 和 E–I)显示出强相关性,这与基本领域知识一致。然而,一个关键的观察是,模型几乎在所有传感器节点之间都分配了非零权重,导致图结构密集且纠缠。虽然这证实了有效的故障诊断需要分析传感器通道之间的整体相互关系,但它也揭示了一个显著的局限性:在没有物理约束的情况下,数据驱动的模型难以区分真正的因果耦合和虚假的统计相关性,导致了对系统状态的“噪声”解释。

4.3.2. 我们提出的模型的结果
与基线相比,PTAL 框架通过在物理锚定的拓扑上应用图注意力网络(GAT)引入了空间依赖性。PTAL 不是从头开始学习边的存在,而是通过梯度下降学习物理有效连接的注意力系数。这一过程量化了在特定操作条件下耦合组件之间的影响强度,有效地代表了神经网络对给定批次内空间关系的理解。为了便于可视化并揭示主导的耦合路径,我们剪掉了注意力权重接近零的边。图 14a 显示了 résult 之间的加权图结构。与图 3 中显示的静态物理示意图相比,PTAL 学习到的图突出了空间相关性的动态强度,揭示了驱动故障演变的潜在依赖性。此外,为了明确追踪不同传感器对特定故障模式的敏感性,我们构建了一个增强的可视化图,如图 14b 所示。在这种表示中,故障类型被引入作为辅助节点。为了帮助识别根本原因,传感器通道和故障节点之间的连接以红色突出显示。这些高权重路径表明了传感器变量对识别特定故障最有贡献,从而为 PTAL 框架的诊断决策过程提供了透明解释。

4.4. 效率和性能-复杂度权衡
为了验证在资源受限的部署要求下的轻量级设计,我们使用图 15 中的准确性-复杂度权衡图总结了诊断性能与计算复杂性之间的关系,其中复杂性由模型大小和每个输入窗口的计算量来表征。这种可视化突出了 PTAL 与基线之间的相对效率。

5. 结论
5.1.**摘要与关键见解**
所提出的物理-拓扑锚定学习(PTAL)框架展示了在复杂系统(如RLREs)中物理归纳 bias 的关键价值。该研究揭示了将深度学习与物理因果关系相结合的基本优势:

1. **物理正则化**:物理归纳 bias 起到一个强大的正则化器的作用,有效限制了模型的假设空间。与需要大量数据集来学习潜在关系的纯数据驱动架构不同,PTAL 中的“硬”结构锚定机制确保了即使在数据稀缺的情况下也能保持高度的诊断稳定性。
2. **稀缺条件下的补偿效应**:在少量样本场景下,PTAL(97.8%)与基础 LSTM 模型(93.6%)之间的显著性能差距表明,明确的物理拓扑结构通过提供特征传播的确定性路径来弥补故障样本的缺失。
3. **效率突破**:通过在图卷积逻辑中引入物理稀疏性,PTAL 在保持高准确性的同时显著降低了计算开销。与大型 Transformer 系列模型(如 FEDTransformer,2600 万个参数)相比,PTAL 仅使用 380 万个参数就实现了可比的性能,证明了其在资源受限的航空航天应用中的实际潜力。

**5.2. 局限性与未来工作**
尽管 PTAL 框架表现出色,但它仍存在一些局限性,这些局限性为未来的研究方向指明了方向:
1. **对先验知识的依赖**:当前框架依赖于预定义的物理邻接矩阵,这假设了对系统连接性的完全且准确的了解。在物理模型不完整或不确定的情况下,框架的有效性可能会受到影响。
2. **自适应调整机制**:未来的研究将探索“混合学习-物理图”。通过在确定性物理图的基础上引入可学习的小规模残差分支(软锚定),模型可以自适应地纠正理想化物理模型与实际物理过程之间的差异。
3. **可扩展性与验证**:未来的工作还将重点关注将 PTAL 扩展到多引擎系统,并利用实际飞行遥测数据来进一步提高框架在极端飞行环境下的鲁棒性和可靠性。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号