基于条件敏感伪标签的知识图谱增强元学习方法,用于多种工作条件下的半监督故障诊断

《Expert Systems with Applications》:Knowledge Graph Augmented Meta-Learning with Condition-Sensitive Pseudo-Labeling for Semi-Supervised Fault Diagnosis under Multiple Working Conditions

【字体: 时间:2026年02月21日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本文提出基于知识图谱增强的元学习与半监督条件敏感伪标签方法(KG-CAML-SS),通过整合设备结构关系与过程变量关联构建知识图谱,嵌入任务级结构表示捕捉多工况变化,设计条件敏感网络动态选择高置信度伪标签,结合自适应原型融合机制提升分类性能。实验表明该方法在污水处理和Tennessee Eastman工业数据集上显著优于基线方法。

  
吴克宇|徐源|罗毅|柯伟|何彦琳|朱群雄|张阳|张明清
北京化工大学信息科学与技术学院,北京,100029,中国

摘要

由于故障发生率低且手动标注成本高,多种工作条件下的工业场景面临样本稀缺和分布显著变化的问题。为了解决这一挑战,本文提出了一种名为“基于知识图谱增强的元学习与条件敏感伪标签算法(KG-CAML-SS)”的半监督故障诊断方法。在元学习框架内,KG-CAML-SS通过整合设备结构关系与过程变量相关性来构建领域知识图谱。该知识图谱通过关系图卷积网络结合全局均值池化进行嵌入,以获得任务级别的结构表示,从而增强模型捕捉多种工作条件变化的能力。随后,设计了一种基于度量的条件敏感网络来评估未标记样本与其最近和次近类中心之间的相似性差异,并据此制定置信比准则以实现自适应的高可靠性伪标签选择。此外,引入了一种自适应原型融合机制,将每个类原型与其对应的高置信度伪标记特征动态融合。最终,使用精炼后的原型对查询样本进行分类,从而在未见过的工况下实现准确的故障诊断。在两个真实工业过程数据集上的实验结果表明,所提出的KG-CAML-SS方法在多种工作条件场景下具有显著的诊断性能和泛化能力。

引言

在现代过程工业中,设备和过程变量的状态在原材料组成、生产负荷和控制策略的变化驱动下不断演变。这些变化自然会导致不同操作模式下的数据分布发生显著变化(Han, Liu, He, Ding, & Zhou (2025); Yao, Zhao, Zhao, Guo, & Deng (2024))。这些变化不仅降低了假设单一分布的故障模型的准确性,还增加了诊断算法的泛化难度(Li, Liu, Sun, Qin, & Chu (2024); Li et al. (2025))。同时,故障在正常运行期间发生频率较低,导致故障样本极为稀缺,大量操作数据仍未被标记(Chen, Chen, Guo, & Zhai (2025a))。为了应对这些挑战,人们广泛研究了领域适应和迁移学习技术,以减轻跨条件分布变化对传感器测量的不利影响。
领域适应方法(Tian et al. (2024))通过 align 特征表示来增强跨领域泛化,从而缩小分布差距。例如,An et al. (2023) 开发了一种基于对比学习的领域适应网络,以提高特征区分度并减少边界误分类。迁移学习(Tang, Ma, Yan, Zhu, & Khoo (2024) 通过将源领域学到的知识转移到目标领域来减少对目标领域标记数据的依赖。Yan et al. (2024) 提出了一种基于双重校正训练(FTSDC)的新型联邦迁移学习策略,能够在不使用目标领域样本的情况下实现隐私保护和准确的跨机器故障诊断。然而,大多数现有方法仍然严重依赖于源领域的丰富标记数据或目标领域的部分标记数据,并未充分利用目标领域通常存在的丰富未标记信息。
最近,元学习(Zhang, Ye, Wang, & Habetler (2021); Zhou, Zhang, Huang, & Cai (2024) 在故障诊断领域受到了广泛关注。通过学习跨任务的通用适应策略,该方法能够仅使用少量标记样本快速适应新任务。鉴于来自不同工作条件的数据可以被视为不同的任务,元学习被认为是一种解决小样本和多种工作条件下的故障诊断挑战的有前景的方法。为了实现少样本故障诊断,Lin et al. (2023) 提出了一种通用的模型不可知元学习(GMAML)方法,用于异构信号下的少样本跨领域轴承故障诊断,该方法结合了多核高效通道注意力特征编码器。Gao et al. (2024) 提出了一种结合GRU特征提取和元学习的方法,用于未见过的工业条件下的故障诊断。尽管取得了这些进展,但由于真实工业环境中标记故障数据的极度稀缺,元学习方法的实际应用仍然受到限制。
为了解决这一限制,半监督学习被广泛采用,以在有限的监督下利用丰富的未标记数据。Xu et al. (2024) 提出了一种半监督图嵌入低秩张量学习框架,该框架将张量核范数正则化与流形图嵌入相结合,使用少量标记数据有效表征多维信号中的结构相关性。在此基础上,Su, Yao, Xiang, & Hu (2024) 通过将未标记数据纳入任务适应和跨任务知识转移,实现了在少样本场景中的快速决策边界适应和对未见操作条件及新型故障模式的改进泛化。Feng et al. (2022) 开发了一种配备挤压-激发注意力机制的半监督元学习网络,该网络利用未标记数据自适应地强调区分性特征并精炼类原型,从而在变化的操作条件和噪声环境中实现高度准确的少样本故障诊断。然而,在复杂操作条件转换和系统动态显著变化的情况下,不同条件之间的分布变化频繁出现,使得伪标签的可靠性难以保证。此外,故障类型之间的分布几何形状和类可分性的显著差异进一步增加了错误积累的风险。
本研究提出了一种名为“基于知识图谱增强的元学习与半监督条件敏感伪标签算法(KG-CAML-SS)”的半监督故障诊断方法。KG-CAML-SS构建了一个特定于过程的知识图谱,将结构化领域知识与数据驱动的变量相关性整合在一起,然后将其嵌入到任务建模过程中,形成具有明确过程语义的结构化任务表示。随后,使用关系图神经网络(RGCN)学习图表示,提取捕捉变量依赖性和操作条件特征的高级特征。在这些表示的基础上,设计了一种基于度量的条件敏感网络来表征未标记样本与其最近和次近类原型之间的相似性差异。此外,引入了一种自适应原型融合机制,将每个类原型与其对应的高置信度伪标记特征动态融合,从而精炼类表示并增强模型的区分能力。在废水处理厂(WWTP)和田纳西东曼(TE)工艺上的实验结果表明,所提出的KG-CAML-SS方法在多种操作条件和少样本场景下始终实现了显著更好的故障诊断性能。
本研究的主要贡献如下:
1. 在知识图谱框架内,开发了一种名为KG-CAML-SS的半监督元学习方法,用于在多种工作条件下的少样本故障诊断,该方法通过整合过程数据和领域知识来实现。
2. 开发了一种基于度量的条件敏感网络,根据条件差异调整距离度量,从而提高伪标签选择的可靠性。
3. 开发了一种逐类自适应融合机制,用于学习类特定的融合权重以精炼原型,明确解决伪标签可靠性的类级差异并提高更新稳定性。
本文的其余部分组织如下:第2节简要介绍了半监督学习、元学习和知识图谱的基本概念。第3节详细介绍了所提出的KG-CAML-SS框架。第4节展示了在TE工艺和WWTP等实际应用上的实验结果和综合分析。最后,第5节总结了本文。

节选内容

半监督学习

在现实世界的工业场景中,由于故障发生频率低,故障数据非常稀缺。此外,标注过程通常依赖于专家诊断或受控的实验条件,这使得标注成本高昂且效率低下。为了解决标记数据有限与未标记数据未充分利用之间的不平衡问题,半监督学习(Yang, Song, King, & Xu (2022) 将少量标记样本与大量未标记数据相结合,以揭示潜在的关系。

提出的KG-CAML-SS算法

为同时解决多种工作条件下的分布变化、故障样本稀缺以及未标记数据未充分利用的问题,本研究提出了KG-CAML-SS方法,以实现复杂工业系统中的高效故障诊断。如图3所示,KG-CAML-SS方法包括三个主要部分:知识图谱构建与编码、基于度量的条件敏感伪标签网络和逐类自适应融合。

实验研究

为了评估所提出的KG-CAML-SS方法的有效性,在相同的实验设置下实现了几种基线模型进行比较,包括在田纳西东曼(TE)工艺和废水处理厂(WWTP)中的应用。这些方法包括完全监督、半监督和基于元学习的方法。表1显示了七种比较方法和推荐方法的训练和测试细节。

结论

本文提出了一种KG-CAML-SS故障诊断方法,该方法通过特定于过程的知识图谱引入领域知识,并整合了条件敏感的伪标签机制,以解决故障样本稀缺和多种操作条件下的变化问题。该框架将过程数据和领域知识共同建模为统一的知识图谱,然后通过RGCN和全局均值池化进行编码,生成用于分类的任务级别表示。

CRediT作者贡献声明

吴克宇:撰写原始草稿、方法论、可视化、软件。徐源:方法论、概念化、项目管理、监督。罗毅:形式分析、调查、项目管理。柯伟:形式分析、资源获取。何彦琳:撰写-审稿-编辑、监督。朱群雄:可视化。张阳:撰写-审稿-编辑、监督。张明清:概念化、监督、撰写-审稿-编辑。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号