《Journal of Computational Design and Engineering》:MDCSformer: Multi-scale Dilated Contracted Sub-Transformer for Fault Diagnosis of Rotating Machinery
编辑推荐:
为解决旋转机械在强噪声环境下故障诊断精度低、模型计算开销大的问题,研究人员开展了MDCSformer(多尺度空洞压缩子Transformer)的研究。该研究通过整合多尺度空洞卷积(MDC)与压缩多头子自注意力(CMSS)模块,实现了对振动信号的高效特征提取与精炼。实验结果表明,MDCSformer在三个基准数据集上均取得了最高诊断精度(最高达0.997),且在强噪声条件下性能下降最小(最低仅4.40%),显著优于CNN、Transformer及其混合模型,为工业场景下的智能运维提供了更鲁棒、高效的解决方案。
在工业4.0时代,旋转机械作为电力、制造等核心工业系统的“心脏”,其健康状态直接关系到生产安全与效率。然而,这些设备长期在高温、高负载等恶劣工况下运行,极易发生故障,导致非计划停机,造成巨大的经济损失。因此,对旋转机械进行精准、实时的故障诊断,已成为工业界和学术界共同关注的焦点。
传统的故障诊断方法高度依赖专家经验,通过信号处理技术提取特征,再送入分类器进行判断。这种方法在理想环境下表现尚可,但在实际工业场景中,振动信号往往被强烈的背景噪声所淹没,导致诊断性能急剧下降。近年来,以卷积神经网络(CNN)为代表的深度学习技术,凭借其强大的特征自动提取能力,在故障诊断领域取得了显著成功。然而,CNN也存在其固有的局限性:其固定的卷积核尺寸难以有效捕捉故障特征在时间尺度上的多样性,而为了扩大感受野,盲目增加卷积核尺寸又会带来模型参数和计算量的爆炸式增长。
与此同时,在自然语言处理和计算机视觉领域大放异彩的Transformer模型,因其能够通过自注意力(Self-Attention)机制捕捉序列中的长距离依赖关系,也被引入到故障诊断中。然而,标准的Transformer模型计算复杂度高,且对数据量要求苛刻,在工业数据有限的情况下,直接应用往往效果不佳,甚至不如简单的CNN模型。
面对这一挑战,研究人员开始探索将CNN的局部特征提取能力与Transformer的全局上下文建模能力相结合的混合模型。然而,现有的混合模型大多只是将CNN和Transformer模块进行简单的串联,未能充分发挥两者的协同优势。如何设计一种既能高效提取多尺度特征,又能以低计算成本进行全局信息精炼的架构,成为当前研究的关键瓶颈。
为了攻克这一难题,首尔大学的Chan Hee Park团队在《Journal of Computational Design and Engineering》上发表了一项创新性研究,提出了一种名为MDCSformer(Multi-scale Dilated Contracted Sub-Transformer)的全新架构。该模型通过巧妙融合多尺度空洞卷积(MDC)与压缩多头子自注意力(CMSS)机制,在保证高诊断精度的同时,显著提升了模型在强噪声环境下的鲁棒性。
关键技术方法
本研究主要采用了以下关键技术方法:
- 1.
多尺度空洞卷积(MDC):利用不同膨胀率的空洞卷积核并行提取信号特征,在不增加参数量的前提下,有效扩大感受野,捕捉从局部到全局的多尺度故障特征。
- 2.
压缩多头子自注意力(CMSS):提出一种轻量化的注意力机制,通过通道压缩和子空间划分,在低维空间内计算注意力,有效抑制噪声冗余,突出诊断相关特征,同时大幅降低计算开销。
- 3.
MDCS模块:将MDC与CMSS集成在一个残差块中,构建了MDCSformer的核心模块,实现了特征提取与精炼的协同工作。
- 4.
消融实验:通过构建多个变体模型(如DCC、DDC、DDD、MHSA-h2/h4),系统性地验证了MDC和CMSS模块各自的作用及其协同效应。
- 5.
噪声鲁棒性评估:在三个公开数据集(直齿轮箱、斜齿轮箱、轴承)上,通过注入不同信噪比(SNR)的高斯白噪声,定量评估了模型在强噪声干扰下的性能表现。
研究结果
1. 模型架构与消融分析
MDCSformer采用四阶段架构,依次为卷积主干、MDC块、两个MDCS块以及分类器。其中,MDCS块是模型的核心创新,它首先通过MDC层提取多尺度特征,然后利用CMSS模块对这些特征进行精炼,最后通过步长为2的卷积进行下采样。消融实验结果表明,无论是移除CMSS模块(DCC、DDC、DDD变体)还是将其替换为标准的多头自注意力(MHSA-h2/h4),模型的诊断精度均出现明显下降,证明了CMSS模块在特征精炼和噪声抑制方面的独特优势。
2. 案例研究一:直齿轮箱数据集
在PHM 2009直齿轮箱数据集上,MDCSformer取得了0.994±0.001的最高诊断精度,显著优于ResNet、Dilated ResNet以及基于Transformer的Signal TF和TSTF模型。混淆矩阵显示,MDCSformer的预测结果几乎完全呈对角线分布,仅存在极少数误分类样本。t-SNE特征可视化进一步证实,经过MDCS块处理后,不同故障类别的特征簇分离度显著提高,类间边界更加清晰。
3. 案例研究二:斜齿轮箱数据集
在PHM 2009斜齿轮箱数据集上,MDCSformer再次展现出卓越性能,平均准确率达到0.997±0.001。对于包含复杂故障组合的类别(如齿轮断裂、轴承故障和轴不平衡),模型实现了完美的识别。消融实验同样表明,CMSS模块对于区分正常状态和简单故障(如齿轮崩齿)具有重要作用,其缺失会导致模型在这些类别上的性能下降。
4. 案例研究三:轴承数据集
在KAIST提供的轴承数据集上,MDCSformer在更具挑战性的条件下(包含负载变化)依然表现稳健,平均准确率为0.983±0.001。模型对内圈故障和不对中故障实现了100%的识别,但对于正常状态和不平衡状态的区分存在一定难度,这主要源于不平衡源距离传感器较远,导致振动特征较弱。尽管如此,MDCSformer仍显著优于其他对比模型,证明了其处理复杂工况的能力。
5. 噪声鲁棒性实验
为了评估模型在恶劣工业环境下的性能,研究人员在测试信号中注入了不同信噪比(SNR)的高斯白噪声。结果表明,随着噪声强度的增加(SNR从10 dB降至-2 dB),所有模型的诊断精度均出现下降,但MDCSformer的下降幅度最小。在三个数据集上,MDCSformer的精度下降率分别为29.62%、50.79%和4.40%,远低于其他对比模型,尤其是在斜齿轮箱数据集上,其性能优势最为明显。
6. 注意力图分析
为了增强模型的可解释性,研究人员分析了MDCS块中CMSS模块生成的注意力图。结果显示,在第一个MDCS块中,注意力分布较为广泛,模型在探索特征间的广泛依赖关系;而在第二个MDCS块中,注意力变得更加集中和选择性,模型将注意力聚焦于对诊断至关重要的少数通道组合上。这种从“广泛探索”到“聚焦精炼”的演变过程,直观地展示了MDCSformer如何通过分层处理,逐步抑制噪声,强化关键特征,最终实现稳健的诊断。
结论与讨论
本研究提出的MDCSformer,通过将多尺度空洞卷积(MDC)与压缩多头子自注意力(CMSS)机制进行协同设计,成功构建了一个高效且鲁棒的旋转机械故障诊断框架。该模型的核心优势在于,MDC模块能够以较低的计算成本捕获广泛的时间尺度特征,而CMSS模块则通过子空间注意力机制,对这些特征进行选择性精炼,有效抑制了噪声引起的冗余,并突出了诊断相关的关键模式。
广泛的实验验证表明,MDCSformer在三个不同的基准数据集上均取得了最先进的诊断性能,并且在强噪声干扰下表现出最小的性能退化。消融研究、注意力图分析以及超参数敏感性分析,共同证实了模型架构设计的有效性和鲁棒性。
尽管MDCSformer在实验室数据集上取得了显著成功,但作者也指出了其局限性。目前的评估主要基于受控、恒速条件下的数据,而真实工业环境往往涉及变转速、变负载以及多传感器配置等复杂因素。因此,未来的工作应致力于将MDCSformer应用于更广泛的工业场景,并探索其在域自适应、迁移学习等方面的潜力,以进一步提升其在真实工业环境中的泛化能力和实用价值。