IBL-AE:一种可解释的基础学习自动编码器,用于旋转机械的智能故障诊断
《Knowledge-Based Systems》:IBL-AE: An Interpretable Base Learning Autoencoder for Intelligent Fault Diagnosis of Rotating Machinery
【字体:
大
中
小
】
时间:2025年10月23日
来源:Knowledge-Based Systems 7.6
编辑推荐:
可解释的深度学习模型IBL-AE通过整合非负矩阵分解原理实现故障诊断的可视化与物理意义关联,在保持分类精度的同时提供透明决策机制。
深度学习在故障诊断领域展现出了强大的能力,然而其内部决策机制的不透明性严重限制了其在关键工程场景中的应用。为了解决这一问题,本文提出了一种新的深度学习架构——IBL-AE(Interpretable Basis Learning Autoencoder),该架构通过将非负基学习整合到自编码器框架中,实现可解释的故障分类。IBL-AE在潜在空间中引入了受非负矩阵分解(NMF)启发的非负分解模块,使得所学的特征能够明确地与物理可解释的基成分相关联。与后处理可解释性技术不同,IBL-AE通过设计实现了内在可解释性,因为网络权重和输出都可以被可视化,并且直接与指示特定故障类型的频率成分相关联。此外,分类模块利用所学的系数进行决策,以人类可理解的方式进行判断。在三个旋转机械数据集上的大量实验表明,IBL-AE不仅实现了诊断准确性,还提供了对模型行为具有解释性和物理意义的洞察,为工业故障诊断的更可靠和实际应用铺平了道路。
旋转机械是现代工业生产中不可或缺的一部分,但设备的长期运行和复杂的工作环境给其安全运行带来了挑战。深度学习算法通过建立关键部件健康状态与监测数据之间的非线性关系,为设备维护提供决策支持,并在近年来受到了广泛关注。与依赖于先验故障知识的信号处理方法不同,基于深度学习的智能诊断方法展现了强大的自学习和模式识别能力。其中,深度卷积神经网络(DCNN)尤其引人注目。例如,Jin等人设计了多尺度卷积块,以增强模型在噪声和并发故障情况下的鲁棒性。鉴于卷积层在图像特征提取方面的优势,Shao等人引入了一种改进的卷积神经网络(MCNN),使用红外热图像作为输入数据,用于旋转轴承系统的故障诊断。Xin等人则采用了一种改进的自校准卷积神经网络(MSCNet),对经过短时傅里叶变换(STFT)处理后的图像样本进行处理,以识别轮对轴承故障。这些模型通过逐层卷积提取输入样本的深层表示,从而克服了对先验机制的依赖。然而,理解模型所学习的特征及其学习方式仍然面临挑战。此外,网络中大量的参数,使得其难以分析,进一步阻碍了可解释性分析。
为了解决可解释性方面的挑战,研究界提出了两种方法。第一种方法是设计诸如类激活图(CAM)等技术,以解释训练后的模型,这种方法被称为后处理解释。然而,这些方法近年来受到批评,认为其可能存在误导性或不可靠性,突显了直接构建可解释模型的重要性。主流的方法是通过添加额外的预处理层来引入可解释性,例如小波变换和时频变换。例如,Li等人提出了一种基于故障信号冲击特性的小波核网络(WKN),旨在进行特征提取和降噪。Chen等人将具有物理意义的时频卷积嵌入传统卷积层中,考虑了三种典型的时频方法,以定制时频卷积层。Liu等人则基于频谱特征设计了一种Sinc滤波器核,用以替代第一层卷积,通过反向传播逐步学习滤波器函数的结构参数。尽管这些方法在提高模型可解释性方面取得了一定的成功,但只有预处理层是可解释的,其余卷积层之间的特征传输仍然难以理解,尤其是在这些特征如何影响聚类方面,仍然缺乏透明度。这种模型决策的不透明性引发了对模型可信度的担忧,阻碍了其在工程实践中的进一步应用。
非负矩阵分解(NMF)是一种可解释的模型,它将输入数据分解为两个低秩矩阵的乘积,这两个矩阵的元素都受到非负约束。这种形式确保了输入数据可以表示为物理可解释的基特征(如振动信号中的特征频率成分)的加权和,从而实现了内在的可解释性。在此基础上,NMF的迭代优化过程被重新表述为深度神经网络,从而开发了深度NMF(DNMF),用于层次化特征提取。DNMF架构主要遵循三种范式:a)堆叠分解:通过多层NMF实现逐步抽象;b)正则化扩展:图约束DNMF保持特征的流形结构。尽管这些方法提高了表示的深度,但它们仍然继承了NMF的线性加法假设,并在复杂信号环境中面临可扩展性限制。此外,DNMF中的逐层分解可能导致过度分离,从而稀释深层基矩阵的物理可解释性。同时,一些研究尝试将NMF与自编码器结合,以获得可解释的深层表示。然而,在大多数这些混合模型中,NMF和自编码器在功能上是解耦的——自编码器仅作为特征提取器,而NMF则在学习后的特征上进行后处理,提供无相互约束或学习交互的特征。此外,可解释性通常仅限于无监督的潜在特征,而没有在分类决策层进行验证。
为了克服这些局限性,本文提出了一种新的可解释架构——IBL-AE(Interpretable Basis Learning Autoencoder)。与DNMF中增加NMF层数不同,IBL-AE在深度自编码器的潜在空间中结构化地嵌入了NMF的原则。受NMF启发的模块对所学的基矩阵和系数矩阵施加非负约束,从而实现特征可解释性和分类性能的联合优化。这种整合使得可解释的潜在特征能够直接指导诊断决策。需要指出的是,IBL-AE中的自编码器主要作为骨干网络,用于整合受NMF启发的非负基学习模块。本文的工作创新之处并不在于修改自编码器的架构本身,而在于将NMF的原则结构化地嵌入到深度网络中,以实现内在的可解释性。具体而言,卷积编码器作为特征提取器,提供非负的潜在输入;基学习模块(NBL)将这些输入分解为具有物理意义的基特征和非负系数;解码器确保信号的忠实重建;分类器则直接在系数矩阵上运行,该矩阵反映了故障组件的激活模式。与后处理可解释性方法相比,IBL-AE通过设计在潜在空间和决策层中实现了内在的可解释性,使得模型参数和激活都与可测量特征保持一致。
本文将IBL-AE与几种最先进的智能诊断方法进行了比较,并展示了其在可解释性、分类透明度和诊断准确性方面的优势。表1总结了我们的方法与先前工作的定性对比。基于这些观察,我们强调了以下关键贡献:
1)我们提出了一种新的可解释深度学习架构IBL-AE,它将非负基学习整合到深度自编码器框架中,以提取具有物理意义的故障表示。
2)嵌入的基学习模块利用全连接层和非负约束模拟NMF,使得可以通过梯度下降进行端到端训练,并提供直接反映故障相关信号组件的特征基和系数。
3)线性分类器利用所学的系数进行透明且可追溯的诊断决策,克服了传统深度神经网络的黑箱限制。
本文的结构如下。第二部分回顾了NMF,并分析了使用全连接神经网络求解NMF的可行性。第三部分介绍了IBL-AE架构及其训练过程。第四部分提供了案例验证。第五部分讨论了模型的可解释性。最后,第六部分总结了研究。
在NMF部分,我们指出NMF接受一个具有非负元素的输入矩阵,并将其近似分解为两个低秩矩阵的乘积。该过程确保了输入数据可以表示为物理可解释的基特征的加权和,从而实现了内在的可解释性。NMF的核心在于其分解后的基矩阵和系数矩阵能够提供对输入数据的直观解释,而不仅仅是数学上的近似。通过将NMF的分解过程映射到深度学习框架中,可以使得模型不仅具备强大的表示能力,还能够保持其可解释性。这种结合为深度学习在故障诊断中的应用提供了新的思路,使得模型能够更加贴近实际工程需求。
在图像样本构建部分,近年来时频分析方法在故障诊断任务中被认为是非常有效的。通过短时傅里叶变换(STFT)获得的时频图像,将时域中的瞬态特征与频域中的能量分布相结合,克服了一维信号的局限性,如对噪声的敏感性和特征重叠问题。例如,外圈轴承故障的冲击特征表现为周期性变化,这种周期性变化在时频图像中更加明显,有助于更准确地识别故障。通过将时频图像作为输入,可以更全面地捕捉故障信号的特征,提高诊断的准确性和可靠性。因此,本文在构建图像样本时,充分利用了时频分析的优势,以期为后续的故障分类提供更丰富的信息。
在案例验证部分,为了验证所设计的IBL-AE模型的有效性和诊断性能,我们将其与五种先进的智能诊断方法进行了比较,包括MCNN、MSCNet、MSCNN、ResNet18和GWRN。这些模型通过两个开源的轴承故障数据集和一个自建的齿轮箱故障数据集进行验证。实验结果显示,IBL-AE在多个指标上均表现出色,不仅在诊断准确率上优于其他模型,而且在可解释性和分类透明度方面也具有显著优势。此外,实验结果还表明,IBL-AE能够更好地捕捉故障特征的物理意义,使得其在实际应用中更加可靠。通过对比分析,我们可以更清晰地看到IBL-AE在故障诊断中的优势,为工业应用提供了有力支持。
在讨论部分,虽然IBL-AE通过在时频域中引入非负基学习,展现了强大的可解释性和诊断准确性,但在时间特征建模方面仍存在一定的局限性。具体而言,受NMF启发的模块主要作用于时频图像的潜在表示,强调频率局部化的结构。这可能限制了模型对时间周期性和稀疏性模式的全面捕捉,而这些模式是故障发生的重要特征。因此,尽管IBL-AE在频率域中具有良好的可解释性,但在时间域中的建模能力仍需进一步提升。通过引入更多的时域特征提取机制,可以进一步增强模型的全面性和准确性。此外,为了提高模型的鲁棒性,还可以考虑引入更复杂的特征交互机制,使得模型能够更好地适应不同的故障场景。
在结论部分,本文提出了一种通过IBL-AE提升智能诊断模型可解释性的策略。IBL-AE是一种新的架构,将编码、非负基学习、解码和分类整合到一个端到端的框架中。通过将受NMF启发的基学习模块嵌入到自编码器的潜在空间中,网络能够提取具有物理意义的故障相关特征。这种特征不仅能够提供对故障的直观理解,还能在实际应用中指导决策。IBL-AE的引入为深度学习在故障诊断中的应用提供了新的可能性,使得模型能够更加贴近实际工程需求。通过结合非负基学习和自编码器的优势,IBL-AE在保持模型性能的同时,提高了其可解释性,为工业故障诊断的可靠性和实用性奠定了基础。
本文的研究工作得到了中国国家重点研发计划(Grant No. 2024YFC3014900)和辽宁省重点研发计划(Grant No. 2023JH2/101800031)的支持。这些项目为本研究提供了必要的资金和技术支持,使得我们能够在复杂的数据环境中进行深入探索和实验验证。通过这些研究,我们不仅验证了IBL-AE的有效性,还进一步探讨了其在工业应用中的潜力。未来的研究可以进一步优化IBL-AE的结构,使其能够更好地适应不同的故障类型和应用场景,同时提升其在大规模数据环境中的可扩展性和计算效率。此外,还可以探索将IBL-AE与其他先进的深度学习方法结合,以期在故障诊断领域取得更大的突破。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号