
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于生成对抗网络的工业机器故障声音检测模型MaSGAN:一种新型编码器-解码器-编码器架构及其在异常检测中的应用
【字体: 大 中 小 】 时间:2025年06月18日 来源:Expert Systems with Applications 7.5
编辑推荐:
为解决工业机器故障声音样本稀缺及时间相关性捕获难题,研究人员提出基于生成对抗网络(GAN)的MaSGAN模型,通过编码器-解码器-编码器闭环结构学习正常样本分布,结合改进的线性长短期记忆单元(LLSTM)增强时序特征提取。实验表明,该模型在MIMII数据集上AUC达78.40%,显著优于现有方法,为工业异常检测提供零样本学习新范式。
工业机器的异常声音检测是预防故障的关键手段,但现实中存在两大难题:一是故障样本极度稀缺,正常样本与异常样本比例严重失衡;二是机器声音具有复杂的时间相关性,传统方法难以捕捉动态工况下的非平稳声学特征。这些问题导致现有AI模型易过拟合正常样本,对细微异常敏感度不足。
为解决这些挑战,研究人员开发了MaSGAN(故障声音生成对抗网络)模型。该模型创新性地采用编码器-解码器-编码器闭环结构:主编码器学习正常样本分布,次编码器压缩生成样本特征,通过L2
-距离比较潜在特征差异实现异常评分。针对时间相关性,进一步提出LLSTM-MaSGAN,通过改进的线性长短期记忆单元(LLSTM)捕获多尺度时序依赖,其门控机制将记忆细胞状态融入所有门操作,有效应对工业声学信号的动态变化。
关键技术包括:1) 基于通道和频率注意力机制的卷积模块,强化频域特征提取;2) 改进LLSTM单元结构,增强时序建模能力;3) 在MIMII数据集上采用无监督训练策略,仅需正常样本即可实现异常检测。
研究结果
结论与意义
该研究首次将GAN的生成能力与双重编码器的判别机制相结合,开创了工业异常声音检测的新范式。其核心价值在于:1) 仅需正常样本即可训练,突破异常数据稀缺的瓶颈;2) 通过LLSTM单元解决工业声学信号的时变特性问题;3) 为DCASE竞赛等工业检测任务提供可复用的技术框架。论文成果发表于《Expert Systems with Applications》,为智能制造领域的故障预警系统提供了理论支撑和工程实践参考。
生物通微信公众号
知名企业招聘