在现代过程工业中,设备和过程变量的状态在原材料组成、生产负荷和控制策略的变化驱动下不断演变。这些变化自然会导致不同操作模式下的数据分布发生显著变化(Han, Liu, He, Ding, & Zhou (2025); Yao, Zhao, Zhao, Guo, & Deng (2024))。这些变化不仅降低了假设单一分布的故障模型的准确性,还增加了诊断算法的泛化难度(Li, Liu, Sun, Qin, & Chu (2024); Li et al. (2025))。同时,故障在正常运行期间发生频率较低,导致故障样本极为稀缺,大量操作数据仍未被标记(Chen, Chen, Guo, & Zhai (2025a))。为了应对这些挑战,人们广泛研究了领域适应和迁移学习技术,以减轻跨条件分布变化对传感器测量的不利影响。
领域适应方法(Tian et al. (2024))通过 align 特征表示来增强跨领域泛化,从而缩小分布差距。例如,An et al. (2023) 开发了一种基于对比学习的领域适应网络,以提高特征区分度并减少边界误分类。迁移学习(Tang, Ma, Yan, Zhu, & Khoo (2024) 通过将源领域学到的知识转移到目标领域来减少对目标领域标记数据的依赖。Yan et al. (2024) 提出了一种基于双重校正训练(FTSDC)的新型联邦迁移学习策略,能够在不使用目标领域样本的情况下实现隐私保护和准确的跨机器故障诊断。然而,大多数现有方法仍然严重依赖于源领域的丰富标记数据或目标领域的部分标记数据,并未充分利用目标领域通常存在的丰富未标记信息。
最近,元学习(Zhang, Ye, Wang, & Habetler (2021); Zhou, Zhang, Huang, & Cai (2024) 在故障诊断领域受到了广泛关注。通过学习跨任务的通用适应策略,该方法能够仅使用少量标记样本快速适应新任务。鉴于来自不同工作条件的数据可以被视为不同的任务,元学习被认为是一种解决小样本和多种工作条件下的故障诊断挑战的有前景的方法。为了实现少样本故障诊断,Lin et al. (2023) 提出了一种通用的模型不可知元学习(GMAML)方法,用于异构信号下的少样本跨领域轴承故障诊断,该方法结合了多核高效通道注意力特征编码器。Gao et al. (2024) 提出了一种结合GRU特征提取和元学习的方法,用于未见过的工业条件下的故障诊断。尽管取得了这些进展,但由于真实工业环境中标记故障数据的极度稀缺,元学习方法的实际应用仍然受到限制。
为了解决这一限制,半监督学习被广泛采用,以在有限的监督下利用丰富的未标记数据。Xu et al. (2024) 提出了一种半监督图嵌入低秩张量学习框架,该框架将张量核范数正则化与流形图嵌入相结合,使用少量标记数据有效表征多维信号中的结构相关性。在此基础上,Su, Yao, Xiang, & Hu (2024) 通过将未标记数据纳入任务适应和跨任务知识转移,实现了在少样本场景中的快速决策边界适应和对未见操作条件及新型故障模式的改进泛化。Feng et al. (2022) 开发了一种配备挤压-激发注意力机制的半监督元学习网络,该网络利用未标记数据自适应地强调区分性特征并精炼类原型,从而在变化的操作条件和噪声环境中实现高度准确的少样本故障诊断。然而,在复杂操作条件转换和系统动态显著变化的情况下,不同条件之间的分布变化频繁出现,使得伪标签的可靠性难以保证。此外,故障类型之间的分布几何形状和类可分性的显著差异进一步增加了错误积累的风险。
本研究提出了一种名为“基于知识图谱增强的元学习与半监督条件敏感伪标签算法(KG-CAML-SS)”的半监督故障诊断方法。KG-CAML-SS构建了一个特定于过程的知识图谱,将结构化领域知识与数据驱动的变量相关性整合在一起,然后将其嵌入到任务建模过程中,形成具有明确过程语义的结构化任务表示。随后,使用关系图神经网络(RGCN)学习图表示,提取捕捉变量依赖性和操作条件特征的高级特征。在这些表示的基础上,设计了一种基于度量的条件敏感网络来表征未标记样本与其最近和次近类原型之间的相似性差异。此外,引入了一种自适应原型融合机制,将每个类原型与其对应的高置信度伪标记特征动态融合,从而精炼类表示并增强模型的区分能力。在废水处理厂(WWTP)和田纳西东曼(TE)工艺上的实验结果表明,所提出的KG-CAML-SS方法在多种操作条件和少样本场景下始终实现了显著更好的故障诊断性能。
本研究的主要贡献如下:
1. 在知识图谱框架内,开发了一种名为KG-CAML-SS的半监督元学习方法,用于在多种工作条件下的少样本故障诊断,该方法通过整合过程数据和领域知识来实现。
2. 开发了一种基于度量的条件敏感网络,根据条件差异调整距离度量,从而提高伪标签选择的可靠性。
3. 开发了一种逐类自适应融合机制,用于学习类特定的融合权重以精炼原型,明确解决伪标签可靠性的类级差异并提高更新稳定性。
本文的其余部分组织如下:第2节简要介绍了半监督学习、元学习和知识图谱的基本概念。第3节详细介绍了所提出的KG-CAML-SS框架。第4节展示了在TE工艺和WWTP等实际应用上的实验结果和综合分析。最后,第5节总结了本文。