基于Mamba架构与多级注意力机制的MLFork模型:面向轴承故障诊断的小样本学习新范式

【字体: 时间:2025年09月16日 来源:Neurocomputing 6.5

编辑推荐:

  本文提出了一种创新性的小样本学习模型MLFork,通过集成双向上下文视觉状态空间(Bi-Context VSS)模块和空间/通道优先向量注意力机制(PSVA/PCVA),显著提升了轴承故障诊断在训练数据有限场景下的性能。该模型在CWRU和PU数据集上展现出卓越的泛化能力和特征提取效率,为工业设备智能运维提供了新解决方案。

  

Highlight

  • 提出融合全局-局部感知特征的MLFork模型,通过多级网络架构整合空间与通道向量注意力路由

  • 创新性双向上下文视觉状态空间(Bi-Context VSS)模块实现多维度全局上下文学习

  • 空间优先注意力(PSVA)与通道优先注意力(PCVA)机制强化特征聚焦能力

  • 采用协方差度量(Covariance Metric)与余弦评分(Cosine Score)双模态分类策略

  • 在PU和CWRU数据集上验证模型在有限数据场景下的卓越性能

The model’s overall structure

在进行分析前,信号表征的适配性至关重要。原始波形数据作为一维时间序列难以区分有效信号与噪声,通过短时傅里叶变换(STFT)将振幅-时间序列转换为频率-时间-振幅三维谱图,形成更丰富的视觉表征。该谱图随后输入特征提取器,通过多层双向上下文视觉状态空间(BCVSS)模块与空间激活特征增强(SAFE)模块处理,生成包含空间与通道信息的特征图。这些特征图分别经由PSVA和PCVA注意力路由处理,最终输入基于协方差度量与余弦评分的双分支分类模块。

Datasets

为验证模型在数据受限与充足场景下的泛化能力,实验采用凯斯西储大学(CWRU)轴承数据集与帕德博恩大学(PU)数据集。两者均包含振动信号,涵盖明显故障类型与难以区分的边缘案例(如不同损伤程度的故障)。CWRU数据集包含驱动端轴承振动数据,采样频率12kHz,含正常状态与三种故障类型(内圈、外圈、滚动体故障),每种故障设三种损伤尺寸(0.18/0.36/0.53mm)。PU数据集更复杂,含多种实际工况组合(不同载荷、转速与损伤类型),包含正常状态、人工损伤与真实磨损故障,采样频率64kHz,提供更接近工业实际的挑战性场景。

General insights on the proposed method and its performances

本研究针对轴承故障诊断中训练数据稀缺的现实问题,提出了兼具小样本适应性与大数据处理能力的MLFork模型。通过双向上下文视觉状态空间(BCVSS)模块与空间激活特征增强(SAFE)模块的组合,模型能够选择性地学习不同全局上下文模式并增强空间特征响应。分离式的空间/通道注意力路由有效降低了分类模块对单一特征图的依赖,使协方差度量与余弦评分模块能更精准捕捉样本间的高维关联。在PU和CWRU数据集上的实验表明,模型在有限样本场景下保持强泛化能力,在充足数据条件下则展现出色的特征提取与分类精度。

Conclusion

我们提出了一种基于MLFork模型的轴承故障诊断新方法。通过将多级分类子架构与特征提取器以向量注意力路由相连接,模型能够聚焦于预测关键信息。借助双向上下文视觉状态空间(BCVSS)和空间激活特征增强(SAFE)模块,MLFork能够选择性地学习多样化全局上下文模式并增强空间特征,最终通过空间级与通道级双分支分类模块实现精准故障分类。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号