具有异质性感知能力的动态超图在半监督分类中的应用
《Knowledge-Based Systems》:Heterophily-Aware Dynamic Hypergraph for Semi-Supervised Classification
【字体:
大
中
小
】
时间:2025年09月19日
来源:Knowledge-Based Systems 7.6
编辑推荐:
针对跨域故障诊断中存在的数据分布差异大、同域样本风险不均衡及多分类器输出不平衡问题,提出多域弱耦合域泛化网络。通过特征弱耦合机制引入样本方差惩罚,降低同域极端分布敏感度;采用分类器弱耦合机制,利用MSE损失最小化多分类器输出差异,提升模型对跨域分布偏移的鲁棒性。实验表明该方法在三个数据集上有效缓解领域偏移,增强诊断适应性。
在现代工业生产中,机械设备的可靠运行是保障生产效率和产品质量的关键因素。然而,由于设备长时间运行、环境变化、材料老化等多重因素的影响,设备故障的发生是不可避免的。因此,对故障类型和位置的及时准确识别变得尤为重要,以减少停机时间和维护成本。传统的故障诊断方法依赖于专家经验和预设的规则框架,这些方法不仅耗时耗力,而且难以适应工业环境复杂多变的特性。随着机器学习技术的发展,数据驱动的智能故障诊断方法逐渐成为研究的热点。
近年来,深度学习技术在故障诊断领域得到了广泛应用,主要得益于其强大的特征提取能力和出色的泛化性能。然而,在实际应用中,一个显著的挑战是训练数据和测试数据之间存在分布差异,这种差异通常源于不同的操作条件或运行状态,即所谓的“领域偏移”问题。这种分布差异可能导致模型在新的操作条件下表现不佳甚至失败。为了解决这一问题,引入了迁移学习中的领域适应策略,该策略通过利用带有标签的源领域数据和无标签的目标领域数据,提高了故障诊断的准确性。Qian 等人提出了适应性中间分布对齐方法,旨在对多个源领域和目标领域进行分布对齐,以实现更精确的故障分类。Dong 等人设计了特征空间定位原则,将已知类别形成超球体,并保留超球体中心区域用于未知样本的可能目标领域。Guo 等人提出了一种两阶段的通用领域适应方法,以增强模型的泛化能力。
然而,在真实的工业环境中,获取少量的目标领域故障数据仍然是一项挑战,且通常难以明确判断故障数据的类型。因此,利用无标签的目标领域数据进行辅助诊断仍难以实现。领域泛化,作为领域适应的一个延伸,能够在不依赖目标领域数据的情况下,从单个或多个源领域中获取领域不变性知识,从而实现更精确的故障分类。其中,单源领域泛化指的是仅使用单个源领域的数据训练模型,以适应未知的目标领域。Guo 等人设计了领域生成模块,通过生成具有显著分布差异的扩展领域来增强单源领域泛化能力。Qian 等人提出了基于决策边界的领域泛化框架,通过获取来自异构源客户端的通用表示映射,实现对目标客户端的泛化故障诊断。他们还设计了动态嵌入损失,基于目标机器的先验物理知识,作为网络的物理约束。Gao 等人开发了一种对抗性迁移网络架构,通过复杂的特征转换和边界均衡领域判别,实现源领域和目标领域之间的特征学习和知识迁移。此外,他们还设计了一组决策融合策略,以实现决策空间中的信息整合。Jia 等人提出了一种动态平衡的双原型网络,通过减少类别和领域层面的分布差异,实现领域不变性特征的提取。Zhao 等人设计了一种多领域类别不平衡泛化框架,即故障关系诱导增强框架,并提出了一种新的数据增强视角,用于捕捉跨领域的不变性类别关系。Lu 等人通过多领域对比编码技术,设计了一种新的对比编码任务和损失函数,以保留领域特异性知识,同时实现跨领域的知识泛化。Song 等人设计了一种领域特异性特征移除分支,将领域不变性特征与领域特异性特征分离,从而仅在领域不变性维度中挖掘通用信息。Gao 等人将提取的特征划分为领域相关特征和故障相关特征,并通过显著性融合方法将这些特征适配性地整合为领域不变性特征,以实现从可见源领域到不可见目标领域的特征学习和知识迁移。Li 等人设计了一种新的方法,结合非确定性采样和非参数对齐准则,以实现局部领域对齐,从而促进领域不变性特征的提取。Xu 等人设计了特征自适应调制模块,利用生成的调制参数对获取的特征进行仿射变换,以提取与特定操作条件相关的重要特征。
尽管上述方法在某些方面取得了进展,但现有的多源领域泛化(MSDG)故障诊断方法大多采用单一分类器或引入辅助分类器,主要关注于学习领域不变性特征或全局特征分布匹配。然而,由于不同源领域的数据分布可能显著不同,这可能导致模型失去对每个源领域数据分布特性的感知,从而影响模型的泛化能力。此外,如何减少同一领域训练样本之间的风险差异,降低模型对领域内样本极端分布变化的敏感性,也是一个重要的挑战。最后,如何平衡多个分类器的预测输出,以适应目标领域的数据分布,从而减少领域间的风险差异,提高模型对领域分布变化和协变量变化的鲁棒性,同样至关重要。
基于上述挑战,本文提出了一种多领域弱耦合领域泛化(MWDG)网络,用于在未知操作条件下进行故障诊断。该网络通过引入多个分类器,并在训练过程中将同一领域内的样本方差作为惩罚项,实现特征弱耦合机制。这一机制有助于减少模型对领域内样本极端分布变化的敏感性。另一方面,分类器弱耦合机制则通过最小化源领域分类器预测输出之间的差异损失,从而降低领域间的风险差异,提高模型对跨领域分布变化和协变量变化的鲁棒性。从理论层面来看,本文探讨了如何将多领域弱耦合机制转化为最小优化问题,并通过在三个不同数据集上的实验验证了所提出的特征弱耦合机制、分类器弱耦合机制以及MWDG模型的有效性和广泛适用性。
本文的结构安排如下。第二部分将介绍相关背景知识。第三部分详细阐述了所提出的MWDG网络的实现细节以及理论分析。第四部分展示了相关的实验结果和分析。第五部分则是本文的结论部分。通过这些内容,我们希望全面展示MWDG网络在故障诊断领域的创新点和实际应用价值。
在多源和单目标领域样本的背景下,本文研究的样本是来自不同操作环境的振动信号。为了简化问题并更清晰地定义所研究的问题,本文引入了一些基本的符号和概念。假设本文研究的数据集是从N个带有标签的源领域中获取的,每个源领域包含一系列的样本。每个样本由输入特征和对应的标签组成。源领域的数据分布可能与目标领域的数据分布存在显著差异,因此,如何在不依赖目标领域数据的情况下,从多个源领域中提取通用信息,是本研究的关键目标。
本文提出的方法主要包含三个核心组成部分:特征弱耦合机制、分类器弱耦合机制以及模型预测输出。特征弱耦合机制通过引入多个分类器,对同一领域内的样本方差进行惩罚处理,以减少该领域内样本之间的风险差异。这有助于降低模型对极端分布变化的敏感性,并通过加权多个分类器的输出进行预测。分类器弱耦合机制则通过最小化源领域分类器预测输出之间的差异损失,从而减少领域间的风险差异,提高模型对跨领域分布变化和协变量变化的鲁棒性。该机制主要通过回归评估指标,如均方误差(MSE)来实现。最后,模型预测输出通过整合多个分类器的预测结果,以适应目标领域的数据分布。
在优化目标方面,本文为每个核心组成部分设计了相应的损失函数。对于特征弱耦合机制,通过引入样本方差作为惩罚项,可以减少同一领域内样本之间的风险差异,从而增强模型对领域内极端分布变化的鲁棒性。对于分类器弱耦合机制,通过最小化源领域分类器预测输出之间的差异损失,可以减少领域间的风险差异,提高模型对跨领域分布变化的适应能力。最后,模型预测输出则通过整合多个分类器的预测结果,以实现对目标领域数据分布的适应。
本文提出的方法旨在通过多领域弱耦合机制,提升模型在未知操作环境下的适应能力。该机制不仅关注于提取领域不变性特征,还通过多个分类器的协同作用,增强模型对不同源领域数据分布的感知能力。此外,通过减少同一领域内样本之间的风险差异,模型可以更好地适应领域内可能存在的极端分布变化。在分类器层面,通过最小化预测输出之间的差异损失,模型可以减少领域间的风险差异,从而提高其对跨领域分布变化和协变量变化的鲁棒性。
在实验部分,本文对JNU、BJTU和Ottawa三个数据集进行了广泛的实验,以验证MWDG方法在领域泛化方面的优越性能。实验结果表明,MWDG方法在不同源领域和目标领域的数据分布下均能实现良好的泛化能力,且在故障分类任务中表现出更高的准确性和稳定性。通过这些实验,我们进一步验证了特征弱耦合机制和分类器弱耦合机制的有效性,并展示了MWDG模型在实际应用中的潜力。
综上所述,本文提出了一种多领域弱耦合领域泛化网络,用于在未知操作条件下进行故障诊断。该方法通过引入多个分类器,并在训练过程中将样本方差作为惩罚项,实现特征弱耦合机制。同时,通过最小化源领域分类器预测输出之间的差异,实现分类器弱耦合机制。这些机制共同作用,使得模型能够更好地适应不同源领域和目标领域的数据分布,从而提高其在未知操作环境下的鲁棒性和泛化能力。本文的实验结果验证了该方法的有效性和广泛适用性,为未来在领域泛化和故障诊断领域的研究提供了新的思路和方法。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号