基于张量的广义超图注意力网络

《Knowledge-Based Systems》:Generalised Tensor-based Hypergraph Attention Network

【字体: 时间:2025年10月23日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  本文提出了一种基于ResNet50的多尺度自适应注意力机制模型MSCKE-CFMSS-ResNet50,通过融合通道维度的自适应池化和多尺度卷积核选择(MSCKE模块),以及空间维度的通道重排和独立注意力图生成(CFMSS模块),有效提取并增强轴承故障信号中的关键特征。实验表明,该模型在-4dB至-10dB噪声条件下,故障诊断准确率分别提升1.9%和3.82%,且在参数量上仅增加6.5%,显著优于传统SE、ECA、CBAM等注意力机制。

  在工业制造领域,轴承的状态对设备的安全至关重要。然而,轴承通常在恶劣且复杂的环境中运行,这使得其故障诊断面临诸多挑战。为了提高在强噪声干扰下的轴承故障诊断准确性,本文提出了一种结合多尺度注意力机制的增强型深度残差网络(MSCKE-CFMSS-ResNet50)。该模型在通道维度采用自适应池化权重和多尺度可选卷积核,以实现有效的信息聚合;在空间维度,它通过特征图分组、推断个体注意力图以及引入特征图洗牌操作,增强不同组之间的信息交换。将这种注意力结构嵌入残差网络,不仅提升了特征提取和故障分类的性能,还增强了网络在高噪声环境中的鲁棒性和适应性。

在噪声条件为-4dB到-10dB的情况下,该模型在公开的滚动轴承故障数据集上的验证结果显示,其准确率比现有注意力机制和传统残差网络分别提高了1.9%至3.82%。此外,它还优于多个当前最先进的模型,通过消融实验验证了多尺度卷积核和通道洗牌操作的有效性。这些结果表明,该模型在高噪声环境下的诊断准确性和鲁棒性具有显著优势,同时具备强大的适应能力。

### 背景与研究意义

作为各种大型机械的核心组件,轴承对于设备的正常运行至关重要。任何轴承故障都可能导致设备运行异常,甚至使整个系统瘫痪,往往造成严重的人员伤亡和无法挽回的经济损失。因此,提高滚动轴承故障监测与诊断技术引起了广泛关注。自20世纪60年代以来,轴承故障诊断主要依赖于专家系统和经验积累,例如基于采集的振动信号进行相应的信号分析。这些方法不可避免地存在一定的主观性,如果无法实时掌握故障情况,可能会带来严重后果。

随着人工智能浪潮的到来,越来越多的研究人员开始探索基于数据驱动的故障诊断方法,这与深度学习领域相结合。例如,Chen等人使用深度玻尔兹曼机、深度置信网络和堆叠自动编码器来识别轴承故障,其可靠性较高。然而,这些方法在特征提取方面没有充分考虑时间和频率域中的有效信息。Tang等人则使用二维时间-频率图作为网络输入,实验表明在多故障情况下,准确性可以得到一定程度的提升。但网络结构缺乏进一步的优化,未能实现更精确的故障诊断。

近年来,基于注意力机制的深度学习方法在处理轴承故障诊断的强噪声环境方面取得了显著进展。注意力机制作为一种独特的网络组件,模拟了人类处理信息的方式,能够自动学习并计算输入数据对输出数据的贡献,分配相应的权重,使网络更关注需要关注的区域,抑制无用信息,并在几何变换中保持几乎不受影响。Zhang等人设计了一种多位置、多尺度、多层级信息注意力激活网络,其在不同类型的强噪声环境中表现出色,能够有效过滤来自不同位置的噪声并提取多维特征。Deng等人提出了一个用于滚动轴承故障诊断的新型多头注意力残差网络(MARNet),实验表明该方法在噪声环境中表现出良好的有效性和优越性。Hu等人引入了一种基于通道关系的Squeeze-and-Excitation网络架构,通过显式建模通道间的依赖关系,自适应地重新校准通道方向的特征响应。Mao等人将高效的通道注意力(ECA)机制与残差网络结合,以自适应预测深度关键特征。然而,这种做法只是简单地使用了注意力机制,未对注意力机制进行优化,仅考虑了通道维度。

Liu等人通过Talking-heads注意力机制增强了关键特征序列,而Zhang等人则提出了Channel Shuffle操作,能够有效增强不同组之间的信息交换,从而提高网络的表示能力。Liu等人提出的ResConvLSTM-Att模型用于时空预测,通过集成残差连接和注意力机制,增强了长期时间依赖建模和空间特征捕捉能力。Chen等人将卷积块注意力模块(CBAM)与卷积神经网络结合,以强调关键特征和自适应调整权重参数。然而,这种方法未能捕捉不同尺度的空间信息以增强特征空间。大多数研究仅考虑了注意力机制的一个维度,而未考虑噪声干扰。

### 提出的MSCKE-CFMSS-ResNet50

为了应对上述挑战,本文提出了一种结合新颖多尺度注意力机制的深度残差网络(MSCKE-CFMSS-ResNet50)用于轴承故障诊断。与现有方法相比,我们引入了两个关键创新:(1)在通道维度,我们提出了MSCKE模块,它超越了标准的Squeeze-and-Excitation和Efficient Channel Attention,通过自适应权重平衡全局平均池化和最大池化,并通过1D卷积替代全连接层,实现多尺度可选卷积核,从而保持通道与权重之间的直接对应关系,增强特征表示;(2)在空间维度,我们提出了CFMSS模块,它与常见的空间注意力机制不同,通过分组特征图推断注意力图,并引入通道洗牌操作以促进跨组信息交换,从而克服了标准分组卷积的副作用。这两个精心设计的模块的串行融合,使得网络能够在通道和空间维度上进行全面的特征学习,特别是在强噪声干扰下进行精确的故障诊断。

### 模块结构与设计

MSCKE-CFMSS-ResNet50网络由输入模块、特征提取模块和分类模块组成。网络的完整结构如图1所示。输入模块使用了数据预处理后获得的波形时间-频率图作为训练集。输入图像经过归一化处理后,传递到下一层进行特征提取。在特征提取模块中,使用注意力模块和残差块提取深度特征。在通道注意力方面,通过深度可分离卷积和膨胀卷积分通道,然后通过自适应调整因子控制全局平均池化和全局最大池化之间的重要比例。在网络训练过程中,使用多尺度可选卷积核进行自适应选择适当的核大小。在空间维度的注意力方面,输入特征图被分组,以推断注意力图,而通道洗牌操作则增强了不同组之间的信息交换。通过将两个维度的注意力串行连接,最终将组合注意力模块插入ResNet50网络,以验证模型对深度神经网络分类性能和准确性的增强效果。

### 通道注意力模块(MSCKE)

MSCKE模块的设计灵感来源于两个关键见解:(1)使用固定池化操作(如仅使用全局平均池化)在强噪声下可能不理想,因为噪声可以扭曲全局特征分布;(2)使用全连接层进行通道加权会破坏通道与权重之间的直接对应关系,导致参数效率低下。为了解决这些问题,MSCKE模块引入了以下方法:(a)使用可学习参数λ,自适应地融合全局平均池化和全局最大池化,使模型能够动态平衡整体特征响应和具有噪声鲁棒性的显著特征;(b)将全连接层替换为使用自适应核大小的1D卷积,从而有效捕捉跨通道交互,同时保持通道与权重之间的直接对应关系。

在MSCKE模块中,使用深度可分离卷积和膨胀卷积分通道,分别获得对应的特征图,然后通过自适应调整因子λ进行加权。λ的初始值设置为0.5,以确保在训练初期两个池化分支的贡献相等。在网络训练过程中,模型会根据实际情况自适应地调整λ的值。通过公式(4)的系数变化,实现后续计算中的特征融合和权重调整。在训练过程中,网络能够自适应地选择更合适的权重分配参数。假设输入层的大小为1×1×C,那么特征图的大小可以通过公式(2)计算,其中H和W分别代表输入图像的高度和宽度。F_GAP是通过对输入特征图进行全局平均池化获得的,反映了全局平均特征分布。F_GMP是通过对输入特征图进行全局最大池化获得的,突出了每个通道的最大值,保留了显著特征。

### 空间注意力模块(CFMSS)

在空间注意力方面,我们考虑了多尺度和多频率的特征表示。通过推断每个特征图子空间的注意力图,可以有效学习特征图中各子空间的跨通道依赖关系。多尺度特征表示有助于更准确地提取轴承故障特征,特别是在多对象环境中。本文中的“对象”并不指实际的多个对象,而是指通过融合获得的不同尺度的特征图,这些特征图包含了多尺度特征。多尺度特征表示能够更准确地提取轴承故障特征,提高网络的表示能力,使网络更有效地编码位置数据。多频率特征表示更适合细粒度图像分类。低频成分包含缓慢变化的特征,而高频成分则代表图像中的细小细节。在不同情况下,赋予不同频率的重要程度也是一种有效的特征图特征学习方法。因此,输入特征图被分为G个互斥的组,每组包含G个特征图。通过深度可分离卷积,然后进行最大池化操作以突出局部信息区域,收集空间信息。然后使用点卷积调整通道数量,通过SoftMax激活函数和扩展维度,将通道数量乘以输入特征图。不同于Squeeze-and-Excitation网络中的激励阶段,本文没有使用具有大量参数的多层感知机结构来捕捉通道之间的依赖关系,而是使用不同特征映射子空间之间的线性关系来整合信息。

### 多维注意力串行融合

通道注意力和空间注意力分别关注通道和空间维度的信息。将这两个类型的注意力连接起来,使网络能够获得更全面的特征表达能力。通道注意力帮助网络学习不同类别之间的特征差异,而空间注意力帮助网络关注特征图中包含丰富故障信息的关键区域,同时忽略无关的背景信息。这种双注意力机制的协同效应使网络能够同时优化和过滤来自通道和空间维度的特征,从而获得更具有表达力的特征表示。例如,在处理内圈故障和外圈故障的特征图时,通道注意力模块可以识别这两个故障类型在通道维度中的最显著特征,而空间注意力模块则进一步锁定故障特征的具体空间位置,使网络能够更准确地区分不同类型的故障特征,提高故障分类的准确性。

### 网络分类模块

对于网络主干提取的特征图,通过全局平均池化计算所有通道特征图的平均值。由于全局平均池化层没有参数,可以在该层防止过拟合,同时有效地整合整体空间信息,使网络更加鲁棒。然后,使用Dropout层在训练过程中忽略一部分神经节点,以防止网络过度依赖某些局部特征,从而减少过拟合。Dropout层可能会导致同一训练周期中某些神经元不活跃,因此权重更新不再依赖于固定交互的隐藏节点。这可以防止某些特征仅影响其他特定特征的情况。最终,通过全连接层将所有节点连接起来,所有提取的特征被合成。输出值被发送到分类器,学习的特征被映射到样本的标签空间中。

### 故障诊断过程

网络的故障诊断过程主要分为三个阶段:数据预处理、模型训练和模型测试。在数据预处理阶段,原始数据信号通过滑动窗口采样、小波时间-频率变换和强噪声干扰等方法进行预处理,然后将预处理后的数据划分为训练集和测试集。在模型训练阶段,使用具有混合域注意力机制的ResNet50残差网络进行学习和训练,通过Adam优化器进行优化。在网络训练过程中,计算输出向量与期望值之间的损失函数。在达到最大训练轮数(本研究中为150轮)后,获得最佳训练模型用于后续使用。在模型测试阶段,将测试集与保存的最佳模型结合,产生最终的故障诊断输出结果。网络性能通过准确率、召回率、特异性等指标进行评估,这些指标是通过预测结果与真实标签的比较计算得出的。

### 数据集

本文使用的实验数据是来自美国Case Western Reserve University的滚动轴承故障数据集。该数据集利用电火花加工技术在滚动轴承的内圈、外圈和滚动元件三个位置引入单点故障。故障直径分别为0.007英寸、0.014英寸和0.021英寸。故障轴承随后被重新安装到测试电机中,电机在0-3马力(HP)的负载下运行,以收集振动数据。通过可视化获得的样本,绘制每种故障在0HP负载下的时域波形图。横坐标表示采样点,纵坐标表示振幅,采样频率为12kHz。原始振动信号在不同工作状态下的差异。值得注意的是,滚动元件故障信号和内圈故障信号之间存在明显的差异。然而,滚动元件故障信号和正常状态信号之间却表现出相当的相似性。

在本实验中,我们选择了9种故障轴承标签和1种正常轴承标签。为了便于卷积神经网络更好地学习特征,每个信号段都经过归一化处理。归一化处理的公式如下:其中,括号内的数字表示与基准模型相比的当前注意力机制的改进幅度。通过观察这些图,可以发现随着噪声水平的增加,信号的信噪比也随之增加,原始特征信息逐渐失去清晰度。相应地,时域图陷入混乱,小波时间-频率图变得更加抽象。人类几乎无法区分原始信号的振动特征,因此从噪声信号中提取有效的故障信息非常困难。选择这两个噪声水平是为了模拟实际工业环境中常见的噪声水平。-4dB噪声水平表示良好的信号质量环境,但仍存在噪声干扰,以反映在更常见场景中的性能。-10dB噪声水平表示更严重的噪声环境。这种极端噪声条件被设计用来严格评估模型在严重声学污染下的鲁棒性和失效边界。尽管这种低信噪比可能代表最坏情况而非平均工业环境,但它可以作为区分不同模型噪声免疫性的关键压力测试。在这些条件下,原始信号几乎完全被淹没,如图7(c)和(f)所示,这使得故障诊断变得非常具有挑战性,并为比较不同算法提供了清晰的基准。需要注意的是,使用-10dB噪声的主要目的是不是要求立即在这一水平上进行实际部署,而是为了在受控的高难度设置中展示模型的优越相对改进和内在鲁棒性。

我们选择了在0-3HP下运行的轴承信号数据,并考虑了无添加噪声、添加-4dB噪声和添加-10dB噪声的情况。每种情况对应的数据库包括1800个训练样本和600个验证样本,数据库的分布如补充文件表B1所示。

### 实验设置

本文的实验设置基于Windows 10操作系统,使用了Intel (R) Xeon (R) Gold 6248R CPU @ 3.00 GHz(双处理器)和Nvidia GeForce RTX 3090 GPU,以及CUDA版本11.3。使用的脚本语言是Python 3.8。为了确保所有实验结果的可重复性和可靠性,研究过程中对随机性进行了严格控制。所有随机过程,包括数据集划分(训练/验证)、模型参数初始化和训练算法本身,都使用了固定的随机种子(42)。此外,为了考虑硬件或软件栈中可能存在的任何剩余非确定性,每个实验都独立重复了三次。所有后续结果部分(如准确率、精确度、召回率)报告的性能指标代表了这三个独立运行的平均值。这三个运行之间的标准差被确认为可以忽略不计(通常低于0.5%),表明了高度稳定和一致的结果。

在ResNet网络的训练过程中,参数设置如下:总训练轮数为150,批大小为32,初始学习率为0.001,学习率调整因子为0.05。当学习率过高时,网络无法收敛,而是在最优值附近震荡。相反,如果学习率过低,收敛会变得缓慢,网络有陷入局部最小值的风险。为了避免上述问题,本文采用了逐步降低学习率的方法,初期学习率较高,以确保一定的学习速度,同时不陷入局部极值点。随着训练轮数的增加,学习率逐渐降低,以确保网络训练后期更精细的学习,提高网络模型拟合的程度。使用的学习率变换公式如下:其中,括号内的数字表示与基准模型相比的当前注意力机制的改进幅度。通过观察这些图,可以发现随着噪声水平的增加,信号的信噪比也随之增加,原始特征信息逐渐失去清晰度。相应地,时域图陷入混乱,小波时间-频率图变得更加抽象。人类几乎无法区分原始信号的振动特征,因此从噪声信号中提取有效的故障信息非常困难。选择这两个噪声水平是为了模拟实际工业环境中常见的噪声水平。-4dB噪声水平表示良好的信号质量环境,但仍存在噪声干扰,以反映在更常见场景中的性能。-10dB噪声水平表示更严重的噪声环境。这种极端噪声条件被设计用来严格评估模型在严重声学污染下的鲁棒性和失效边界。尽管这种低信噪比可能代表最坏情况而非平均工业环境,但它可以作为区分不同模型噪声免疫性的关键压力测试。在这些条件下,原始信号几乎完全被淹没,如图7(c)和(f)所示,这使得故障诊断变得非常具有挑战性,并为比较不同算法提供了清晰的基准。需要注意的是,使用-10dB噪声的主要目的是不是要求立即在这一水平上进行实际部署,而是为了在受控的高难度设置中展示模型的优越相对改进和内在鲁棒性。

### 模块设计的实验验证

在对MSCKE-CFMSS-ResNet50的实验验证中,我们测试了不同的模块插入位置。这些位置包括残差块内部、仅在最后两个层以及在每个残差块之后。所有插入位置和基准网络的训练配置参数保持一致,如第3.7节所述。结果如图8所示,三条曲线分别对应于三个不同插入位置的训练准确率和测试准确率。

### 性能比较实验

为了展示改进的注意力机制在与其他常见注意力机制的比较中的有效性,我们测试了六种组合形式,并使用无添加注意力机制的网络作为基准网络。在比较网络结构时,仅替换注意力单元,而网络训练配置参数保持一致,如第3.7节所述。重复实验的结果如表5所示,包括准确率、参数数量、FLOPs、准确率、召回率等性能指标。表5中的括号内的数字表示与基准模型相比当前注意力机制的改进幅度。

在-10dB噪声数据集下,我们测试了不同的注意力机制组合。结果如表7所示,其中括号内的数字表示与基准模型相比当前注意力机制的改进幅度。当面临增加的噪声干扰时,网络的故障诊断准确率下降。然而,在这些条件下,改进的注意力机制能够显著提升网络性能,准确率比基准网络提高了3.819%,同时比在-4dB噪声下改进的注意力机制提高了1.736%。相应地,其准确率、召回率和特异性等性能指标也提高了5.38%、2.9%和0.31%。同样,与-4dB噪声的情况相比,改进幅度也显著增加,准确率和召回率分别提高了13.52%和0.279%。这表明,即使在故障边缘,我们的模型相比其他方法,仍能显著增强从强噪声中提取区分性特征的能力。实验结果在多个噪声水平(-4 dB和-10 dB)上的一致性,有力验证了我们设计原则在噪声鲁棒特征学习中的有效性。

### 结论

本研究设计了一种增强的注意力机制(MSCKE-CFMSS),并将其整合到ResNet50中,以解决强噪声下的轴承故障诊断问题。MSCKE模块通过自适应卷积核替代全连接层,保持通道与权重之间的直接对应关系,同时融合全局平均池化和最大池化以实现鲁棒的特征聚合。CFMSS模块引入了通道洗牌操作,以增强跨子空间的信息交换,而不会增加参数。这两个模块的串行融合使网络能够关注通道和空间维度中的关键特征,形成多维注意力框架。最终的模型MSCKE-CFMSS-ResNet50能够以高准确率和鲁棒性分类九种故障状态和正常状态。

在CWRU数据集上的实验验证表明,将MSCKE-CFMSS插入到每个残差块之间可以达到最佳性能:在-4dB噪声下诊断准确率提高了2.08%,在-10dB噪声下提高了3.82%,参数数量仅增加了6.5%。比较分析显示,该模型优于当前最先进的方法,包括VDR(高斯)的准确率提高了37.56%,VDR(学生)的准确率提高了7.25%,Gath-Geva的准确率提高了12.41%,CatAAE的准确率提高了3.39%,这证实了其在噪声环境中的优越鲁棒性。

提出的MSCKE-CFMSS-ResNet50在准确率和效率之间取得了平衡,为工业轴承故障诊断提供了一种可靠的解决方案。未来的工作将集中在开发轻量级主干网络,并应用神经架构搜索以进一步增强对复杂工业场景的适应性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号