在数据有限的情况下,用于定量诊断的扩散增强对比学习框架
《ADVANCED ENGINEERING INFORMATICS》:Diffusion-augmented contrastive learning framework for quantitative diagnosis under limited data conditions
【字体:
大
中
小
】
时间:2025年10月11日
来源:ADVANCED ENGINEERING INFORMATICS 9.9
编辑推荐:
轴承故障定量诊断在复杂工况下至关重要,但真实场景中标注故障数据不足。本文提出DiCL框架,通过故障可控的扩散模型生成多类型、多严重程度的合成信号,并构建复合故障标签。采用双分支对比学习强化共享故障特征,抑制无关噪声,引入循环一致性约束提升同类样本语义对齐。实验表明,在仅5%故障训练数据下,DiCL在两个轴承数据集上分类准确率超80%,显著优于基线方法。
在现代工业系统中,旋转设备如轴承和齿轮箱是保障系统正常运行的关键部件。这些设备广泛应用于航空航天、制造、能源和交通运输等多个领域,其运行状态直接影响工业环境的效率与安全。然而,由于设备通常在稳定状态下运行,一旦出现故障,往往会被立即停用以确保安全,这使得获取充分的故障数据变得极具挑战性。因此,如何在有限的故障数据条件下,实现对轴承故障的准确分类与量化诊断,成为当前研究的重要方向。
随着传感技术和工业数字化的迅速发展,机械系统可以实时采集大量运行状态数据。这不仅为故障诊断提供了丰富的数据基础,也推动了从传统方法向数据驱动方法的转变。数据驱动方法能够直接从传感器数据中学习复杂的故障模式,相较于基于规则的传统方法,展现出更强的适应性、可扩展性和诊断准确性。特别是在面对非线性系统行为、未曾见过的故障模式以及多变的操作环境时,数据驱动方法的优势更加明显。这使得它们在智能状态监测和复杂机械传动系统的故障诊断中,具有广阔的应用前景。
然而,即使在数据驱动方法取得显著进展的背景下,故障数据的获取仍然面临诸多困难。一方面,真实世界中的故障样本数量往往有限,因为故障事件较为罕见且难以预测。另一方面,故障数据的标签获取成本较高,通常需要人工分析和专家判断,这进一步加剧了数据的稀缺性。为了解决这一问题,近年来研究者提出了多种数据增强方法,如生成对抗网络(GAN)和扩散模型(Diffusion Model),旨在通过生成额外的样本,弥补数据不足带来的缺陷。
其中,扩散模型因其在数据生成方面的强大能力,逐渐受到关注。与GAN相比,扩散模型在训练过程中更加稳定,能够避免模式崩溃的问题,使其成为处理有限或不平衡数据的有前景解决方案。一些研究者尝试将扩散模型应用于轴承故障诊断,例如通过条件扩散模型生成具有特定故障类型和严重程度的合成信号,从而提升诊断模型的泛化能力。然而,这些方法在实际应用中仍然存在一定的局限性,主要体现在:一是生成的样本往往仅与原始数据的故障类型和严重程度相匹配,缺乏对复杂或中间状态的模拟能力;二是未将扩散模型深度集成到表征学习过程中,限制了其在故障诊断中的潜力。
为了解决上述问题,本文提出了一种新的扩散增强对比学习框架(Diffusion-Augmented Contrastive Learning, DiCL),专门用于在有限数据条件下进行轴承故障的量化诊断。该框架结合了扩散模型和对比学习的优势,旨在通过生成更多样化的故障样本,增强模型对复杂故障模式的识别能力。具体而言,DiCL框架包含三个主要组成部分:一是基于故障控制的去噪扩散概率模型(Denoising Diffusion Probabilistic Model, DDPM),用于生成具有特定故障类型和严重程度的合成信号;二是双分支对比学习策略,通过同时处理两个输入样本构建对比对,引导特征提取网络学习具有故障区分性的表征;三是基于循环一致性约束的复合损失函数,用于确保相同故障类型样本的潜在表征之间具有语义一致性。
在DDPM部分,该模型通过逐步向输入数据添加高斯噪声,构建一个逐渐变差的噪声序列,然后通过去噪过程学习如何从噪声中恢复原始数据。这种机制不仅能够生成高质量的合成信号,还能通过控制噪声添加的强度和频率,实现对不同故障类型和严重程度的精准模拟。相比于传统的数据增强方法,DDPM在生成过程中更加灵活,能够模拟更复杂的故障状态,从而为后续的对比学习提供更加丰富的数据支持。
在双分支对比学习策略中,该策略通过同时处理两个输入样本构建对比对,从而增强模型对故障特征的识别能力。具体而言,这两个样本可能来自不同的数据来源,或者是同一数据的不同变体。通过构建对比对,模型能够学习到故障相关的共享特征,同时抑制与故障无关的随机变化。这种机制有助于提高模型的鲁棒性,使其在面对噪声干扰或数据不一致的情况下,仍能保持较高的诊断准确性。
在循环一致性约束方面,该约束通过一个复合损失函数来实现,确保相同故障类型样本的潜在表征之间具有语义一致性。具体而言,该损失函数不仅考虑了样本之间的相似性,还通过引入循环一致性约束,确保模型在学习过程中能够保持对故障特征的稳定表征。这种机制有助于提高模型在面对多变操作环境时的适应能力,使其能够更准确地识别故障的严重程度。
为了验证DiCL框架的有效性,本文在两个代表性的轴承故障数据集上进行了实验研究。第一个数据集是公开的Paderborn University轴承数据集,该数据集包含了多种故障类型和不同严重程度的信号数据。第二个数据集是来自实验室规模机械传动系统的数据集,该数据集模拟了复杂的工作条件和多变的运行环境。实验结果表明,DiCL框架在有限数据条件下,能够生成高质量的合成信号,并在分类和严重程度估计任务中表现出优异的性能。
特别是在数据量较少的情况下,例如仅使用5%的故障训练数据时,DiCL框架在两个数据集上的分类准确率均超过了80%,显著优于现有的先进方法。这表明,DiCL框架不仅能够有效应对数据不足的问题,还能在有限数据条件下实现高精度的故障诊断。此外,实验结果还显示,DiCL框架在处理复杂或中间状态的故障时,表现出更强的适应能力,这使得它在实际工业应用中具有更大的潜力。
从整体来看,DiCL框架通过结合扩散模型和对比学习的优势,为轴承故障的量化诊断提供了一种新的解决方案。该框架不仅能够生成更多样化的故障样本,还能通过双分支对比学习策略和循环一致性约束,确保模型在学习过程中能够保持对故障特征的稳定表征。这些机制共同作用,使得DiCL框架在有限数据条件下,能够实现更高的诊断精度和更广泛的适用性。
为了进一步提升模型的性能,本文还对DDPM和U-Net等关键技术进行了理论分析。DDPM作为一种生成模型,其核心思想是通过逐步向输入数据添加噪声,构建一个逐渐变差的噪声序列,然后通过去噪过程学习如何从噪声中恢复原始数据。这种机制不仅能够生成高质量的合成信号,还能通过控制噪声添加的强度和频率,实现对不同故障类型和严重程度的精准模拟。U-Net作为一种常用的图像分割模型,其结构特点在于具有对称的编码-解码架构,以及跳跃连接的设计,这些特性使其在处理时间序列数据时表现出良好的性能。
在实际应用中,由于健康样本通常较为丰富,而故障样本较为稀缺,因此本文提出的DiCL框架特别关注于在健康数据充足但故障数据有限的条件下进行故障诊断。这种条件下的诊断任务对模型的泛化能力和适应性提出了更高的要求,而DiCL框架通过生成更多样化的故障样本,以及构建对比对和循环一致性约束,能够有效应对这些挑战。
此外,本文还对实验设计和结果分析进行了详细描述。实验过程中,所有模型均直接在原始振动信号上进行训练和评估,未采用任何预处理或手工特征提取的方法。为了减少随机因素对实验结果的影响,每个实验均重复多次,并取平均值作为最终结果。实验结果表明,DiCL框架在分类和严重程度估计任务中均表现出优异的性能,特别是在数据量较少的情况下,其分类准确率显著优于现有的先进方法。
从研究背景来看,当前的故障诊断方法主要分为两类:一是基于网络结构优化的方法,通过改进模型结构来提升诊断性能;二是基于数据增强的方法,通过生成额外的样本来弥补数据不足的问题。其中,基于网络结构优化的方法虽然能够提升模型的表达能力,但往往需要增加网络的复杂度,这可能导致训练过程中的不稳定性,特别是在处理低质量或非平稳时间序列数据时。而基于数据增强的方法虽然能够生成更多的样本,但往往面临训练不稳定和对超参数配置高度敏感的问题。
为了克服这些局限性,本文提出的DiCL框架结合了扩散模型和对比学习的优势,为轴承故障的量化诊断提供了一种新的解决方案。该框架不仅能够生成更多样化的故障样本,还能通过构建对比对和循环一致性约束,确保模型在学习过程中能够保持对故障特征的稳定表征。这些机制共同作用,使得DiCL框架在有限数据条件下,能够实现更高的诊断精度和更广泛的适用性。
从实际应用的角度来看,DiCL框架的提出对于提升机械系统运行的安全性和可靠性具有重要意义。在工业生产中,故障可能导致设备停机、生产中断甚至安全事故,因此,实现对故障的准确分类和量化诊断,有助于提前预警和及时维护,从而降低维护成本和停机时间。此外,DiCL框架还能够为其他类型的机械故障诊断提供参考,例如齿轮箱、电机等设备的故障分析。
综上所述,本文提出的DiCL框架在有限数据条件下,为轴承故障的量化诊断提供了一种新的解决方案。该框架结合了扩散模型和对比学习的优势,通过生成更多样化的故障样本,构建对比对和循环一致性约束,确保模型在学习过程中能够保持对故障特征的稳定表征。实验结果表明,DiCL框架在分类和严重程度估计任务中均表现出优异的性能,特别是在数据量较少的情况下,其分类准确率显著优于现有的先进方法。这些研究成果不仅为轴承故障诊断提供了新的思路,也为其他复杂机械系统的故障分析提供了有益的借鉴。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号