SmdaNet:基于层次化难样本挖掘与域自适应的工业过程故障诊断神经网络

【字体: 时间:2025年05月23日 来源:Chinese Journal of Chemical Engineering 3.7

编辑推荐:

  为解决工业过程中难样本识别能力不足和跨域特征分布不一致的问题,研究人员提出了一种融合难样本挖掘(HSM)与弹性权重固化(EWC)的深度信念网络(DBN)改进方法SmdaNet。该研究通过损失值划分难/易样本,利用EWC防止知识遗忘,并引入KL散度优化特征空间,在青霉素模拟和TE过程数据集中展现出优越的分类精度(MA达96.7%)和跨域鲁棒性。

  

在现代工业智能化进程中,故障诊断如同给复杂生产线安装"健康监测仪"。然而现有方法面临两大痛点:面对与正常样本特征相似的"狡猾"故障(难样本)时频频误判,当设备工况变化导致数据分布漂移时,模型性能更是断崖式下跌。这就像让只会识别标准普通话的AI去理解方言,诊断准确率(MF)往往不足80%。更棘手的是,传统深度信念网络(DBN)在迭代训练时会产生"知识遗忘"现象——学会新故障特征的同时,把已掌握的诊断知识"抛诸脑后"。

针对这些行业痛点,上海某高校智能系统研究团队在《Chinese Journal of Chemical Engineering》发表的研究中,创新性地提出了SmdaNet框架。该研究通过三阶段技术路线实现突破:首先构建DBN基础模型并依据损失阈值划分难/易样本;接着采用弹性权重固化(EWC)策略锁定重要参数,使模型在专注攻克难样本时仍保留对易样本的诊断记忆;最后引入特征空间域适应机制,通过最小化KL散度使不同工况下的故障特征分布对齐。实验证明该方法在青霉素发酵罐故障识别中,将宏平均精度(MP)提升至97.3%,较传统DBN提高12.6个百分点。

关键技术包括:1)基于受限玻尔兹曼机(RBM)堆叠的DBN架构;2)通过损失函数梯度划分难易样本的层次化挖掘策略;3)EWC算法计算参数Fisher信息矩阵以保护关键权重;4)KL散度驱动的特征分布对齐模块;5)采用t-SNE进行高维特征可视化验证。测试数据来自青霉素模拟平台(Birol开发)和经典TE化工过程数据集。

【DBN基础架构】研究采用三层RBM堆叠结构,可见层与隐层采用sigmoid激活函数。通过对比散度算法(CD-k)快速训练单层RBM,逐层预训练后接入softmax分类器进行微调。该架构在TE过程数据集上基线准确率达89.2%。

【难样本挖掘】定义样本损失值Li>μ+2σ为硬样本(μ为平均损失,σ为标准差)。在青霉素数据集上,该方法自动识别出占比17.8%的边界模糊样本,其初始误分类率高达63.4%。

【EWC优化】计算参数θi的Fisher信息矩阵Fii,构建正则项λ∑Fiii*i)2。实验显示EWC使模型在持续学习新故障时,对已学故障的召回率(R)仅下降2.1%,而传统方法下降达21.7%。

【域适应机制】在特征空间最小化P(h|Xeasy)与P(h|Xhard)的KL散度。t-SNE可视化显示,适应后不同域样本在隐空间的平均JS距离从0.38降至0.11,决策边界清晰度提升47%。

【性能对比】在TE过程的10类故障诊断中,SmdaNet宏F1-score(MF)达96.1%,显著优于WDCNN(91.3%)和DGCN(93.5%)。特别在Fault 5/9等难样本上,准确率提升超15%。

该研究通过"难样本攻坚+知识保护+特征对齐"的三重创新,实现了工业故障诊断技术的突破性进展。其价值不仅体现在指标提升,更开创性地解决了持续学习中的灾难性遗忘问题——EWC使模型像人类专家一样具备"经验积累"能力。特征适应机制则赋予模型应对产线升级的"自适应"特性,这对实现智能制造系统的全生命周期管理具有重要工程意义。未来研究可探索多模态数据融合与边缘计算部署,进一步拓展该方法在工业4.0场景的应用深度。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号