基于非对称卷积和多头自注意力机制的元迁移学习网络,用于在少样本和多条件场景下对水下推进器的故障进行诊断

《Ocean Engineering》:Asymmetric convolution and multi-head self-attention based meta-transfer learning network for fault diagnosis of underwater thrusters under few-shot and multi-condition scenarios

【字体: 时间:2025年10月07日 来源:Ocean Engineering 5.5

编辑推荐:

  水下推进器多工况少样本故障诊断方法研究。本文提出AC-MHSA-MTL框架,通过1D不对称卷积增强尺度适应性,多头自注意力捕捉时序全局依赖,并设计优化度量学习器实现跨域迁移。实验验证其在多工况水下推进器故障诊断中的有效性。

  在当今海洋资源开发和利用不断深入的背景下,水下推进器的可靠运行成为保障作业安全的核心要素。推进器作为水下航行器和海洋工程设备的核心动力单元,其性能直接影响到设备的推力生成、机动性以及整体运行可靠性。因此,推进器的故障诊断能力对于确保系统效能至关重要。然而,目前大多数基于少样本(few-shot)的故障诊断方法主要适用于单一工况条件,而水下推进器的实际运行环境往往复杂多变,包括不同转速、机械应力变化以及深海腐蚀性环境等。这种多工况的复杂性使得相同类型的故障在不同运行条件下表现出不同的特征,导致单一工况模型在面对新工况时泛化能力较差。为了应对这一挑战,本文提出了一种基于非对称卷积与多头自注意力机制的元迁移学习网络(AC-MHSA-MTL),旨在提升少样本环境下水下推进器故障诊断的适应性和准确性。

当前,水下推进器故障诊断面临的主要难题在于样本数据的稀缺性。一方面,关键设备如航天发动机等,由于安全风险,无法通过人为损坏来获取故障数据;另一方面,机械退化过程的模拟需要大量的实验时间和资源投入,且在实际应用中难以满足动态运行条件下的需求。此外,动态工况条件下,信号分布非平稳,导致需要庞大的数据集来训练模型,这在实际操作中并不现实。因此,传统依赖大量标注数据的深度学习方法在少样本场景下表现受限,亟需探索新的技术路径。

近年来,数据驱动的方法在故障诊断领域展现出显著优势。通过从传感器数据中提取故障特征,这些方法能够绕过物理模型的依赖,利用深度学习架构如长短时记忆网络(LSTM)等,有效捕捉系统动态特性、非线性响应,从而实现高精度的故障识别。例如,Xia等人(2021)提出了一种结合深度学习与注意力机制的AUV故障诊断方法,利用数据-注意力机制、双向门控循环单元(BiGRU)网络以及空间注意力,实现了对故障的检测与识别。Ji等人(2021)则引入了一种无模型的深度学习方法,通过序列卷积神经网络(SeqCNN)提取状态信息,预测不同类型的故障,从而实现对AUV故障的识别与分离。Wu等人(2025)提出了一种增强型深度学习推理方法,结合小波包分解(WPD)技术,克服了短时傅里叶变换(STFT)窗口限制的不足,实现了在时间-频率域上的高分辨率分析。Xia等人(2022)开发了一种基于层次化注意力的多源数据融合方法(HAMFD),通过构建层次化特征网络、融合网络和故障网络,实现了对AUV故障的检测与识别。

尽管上述方法在理论上具有优势,但在实际应用中仍面临诸多挑战。特别是在数据稀缺的情况下,模型的泛化能力受到严重影响。传统的深度学习方法通常依赖于大量标注数据,而实际中由于设备故障样本难以获取,导致模型训练受限。因此,研究者们开始关注如何在少样本条件下,利用迁移学习、元学习等技术提升模型的适应性。例如,Wang等人(2023)提出了一种基于迁移和跨域少样本学习的轴承故障诊断方法,通过形态变换将一维振动数据转化为二维视觉表示,并采用改进的跨域少样本学习方法,将源域知识迁移到目标域,实现了对轴承故障的高精度诊断。Jin等人(2023)则提出了一种基于顺序原型网络(OCPN)的框架,结合序数回归与决策偏好损失函数,有效解决了风力涡轮机故障诊断中高质量标注数据不足和故障严重程度评估的问题。Leng等人(2025)开发了GCapNet-FSD,这是一种基于图卷积网络的创新模型,通过整合内部高维胶囊特征与外部稳定的语义特征,并结合图卷积与胶囊型图关系,提升了少样本故障诊断的效率和精度,其在PASCAL VOC07&12和COCO基准上的1-shot检测准确率分别提升了3.7%和0.4%。Shen等人(2025)提出了紧凑稀疏校准网络(CSPCN),通过特征空间优化与实时校准技术,显著提高了少样本持久故障诊断中新增故障类别识别的准确率。Li等人(2025)则引入了一种基于Transformer的元学习方法(TEML),通过多变量时间序列标记化与Transformer编码器,有效捕捉了故障模式中的长期依赖关系,并采用双优化策略平衡类内与类间损失函数,显著提升了诊断精度。

然而,尽管这些方法在特定场景下表现出色,它们在多工况下的适应性仍然存在不足。水下推进器在实际运行中不仅会经历恒定转速,还可能遇到变转速或其他复杂工况,这使得故障特征在不同运行条件下呈现出显著差异。如果模型仅在单一工况下训练,而忽略了其他工况下的特征变化,那么在面对新工况时,模型的诊断效果将大打折扣。为此,研究者们开始探索元迁移学习(Meta-Transfer Learning, MTL)等技术,以提升模型在跨域环境下的泛化能力。Sun等人(2019)提出了一种元迁移学习方法,通过学习任务特定的缩放和偏移函数,使深度神经网络(DNN)能够在少量样本条件下快速适应新任务。这种方法克服了传统元学习中浅层网络容易过拟合的问题,在图像识别基准上取得了突破性成果。Yu等人(2025)则提出了一种基于数字孪生的增强型元迁移学习(EMTL)框架,通过离线数字孪生生成故障数据集,并从分布式应变数据中提取特征,实现了在不同工况下对深海管道的高精度损伤检测。Li等人(2023a)开发了一种基于注意力的深度元迁移学习(ADMTL)方法,通过融合注意力机制与三阶段学习方案,使模型能够在不同工况下快速调整,实现对细粒度故障的精准识别。Li等人(2024)进一步提出了一种集成视觉Transformer与模型无关元学习(MAML)的集成Transformer元学习(ETML)方法,利用加权投票系统进行少样本场景下的轴承故障识别,并具备良好的跨工况适应性。

尽管元迁移学习在少样本跨域故障诊断中展现出潜力,但其在水下推进器故障诊断中的直接应用仍面临关键挑战。这主要源于水下推进系统的复杂动态特性,使得传统方法在多工况下的泛化能力受到限制。例如,常规元迁移学习框架中的特征提取器通常依赖对称卷积核,其受限的接收场导致难以捕捉多尺度的故障特征,特别是在转速波动和水动力负载变化较大的情况下。为了解决这一问题,Ding等人(2019)提出了一种非对称卷积块(ACNet),通过在训练过程中引入1×3和3×1的非对称卷积分支,增强了卷积核对旋转变化的鲁棒性。Yang等人(2024)则开发了非对称深度可分离卷积(ADC),通过将卷积操作分解为多个独立步骤,有效提取了多尺度的故障特征,同时保持了计算效率。

此外,传统固定度量方法在处理非平稳信号时也存在局限。例如,基于循环神经网络(RNN)的框架在建模长序列时表现不佳,主要是因为其难以捕捉层次化的时空依赖关系。Yao等人(2022)指出,这类模型在处理长序列数据时容易出现性能退化,导致故障特征的丢失。同样,近期关于时间序列分析的综述(Thundiyil等人,2023)也强调,传统模型如ARIMA、LSTM和GRU在处理大规模数据集和长距离时间相关性时存在明显缺陷,常导致故障诊断不完整。因此,捕捉长期依赖关系对于时间序列预测和时空预测至关重要。为了解决这一问题,研究者们开始引入自注意力机制,以实现多工况下的动态特征重校准。例如,Zhao等人(2024)提出的ResCNN-LSTM-ATT网络,通过在卷积和循环分支中嵌入注意力门,实现了局部特征提取与全局依赖建模的结合,从而有效捕捉了不同工况下的瞬态故障模式。Du等人(2025)则开发了一种增强通道注意力残差迁移网络,结合双损失非线性独立成分估计、通道注意力层和大语言模型(LLM)微调,优化了注意力分布,提升了水下推进器故障诊断的准确性。

为了进一步提升模型在多工况下的适应性,研究者们还探索了可学习度量函数的设计。例如,FSM3(Wang等人,2021)通过结合监督学习与周期性元学习,利用样本属性和组间相似性联合优化,克服了固定度量方法的静态限制,显著提升了在受限数据场景下的少样本学习效果。PKEMTL(Lei等人,2023)则引入了顺序跟踪知识和自监督诊断任务,通过双知识注入策略,实现了在不同转速条件下的自适应度量调整,显著提高了少样本诊断中的转速泛化能力。这些方法表明,可学习的度量函数在维持模型在多工况下的判别能力方面具有重要作用。

基于上述研究,本文提出了一种基于非对称卷积与多头自注意力机制的元迁移学习网络(AC-MHSA-MTL),旨在解决少样本多工况水下推进器故障诊断中的关键问题。该方法利用元学习在少样本任务中的优势,实现了源域特征的提取,同时引入非对称卷积,以增强卷积核的尺度适应性。此外,多头自注意力机制被用于强化模型对时间序列信号中全局依赖关系的捕捉能力。为了进一步提升模型的泛化能力,还设计了一种优化的度量学习器,用于动态调整相似度函数,从而在不同工况下提供更灵活的相似性评估。经过训练后,特征提取器和度量学习器将被冻结并迁移到目标域,以实现对新工况下故障的准确诊断。实验结果表明,该方法在多工况水下推进器故障数据集上实现了显著的诊断性能和适应性提升。

本文的研究成果不仅为水下推进器故障诊断提供了新的技术路径,也为其他复杂工况下的少样本故障诊断问题提供了借鉴。通过结合非对称卷积与多头自注意力机制,AC-MHSA-MTL在提升模型对多尺度特征的捕捉能力的同时,也增强了其对长期依赖关系的建模能力。此外,优化的度量学习器能够动态调整相似度评估,使得模型在面对不同工况时具备更强的适应性。这些创新点共同构成了AC-MHSA-MTL在少样本多工况故障诊断中的核心优势。实验结果进一步验证了该方法在实际应用中的有效性,表明其在提升诊断准确率和模型泛化能力方面具有显著潜力。

总之,水下推进器的故障诊断技术正面临从单一工况向多工况环境的转变。传统方法在面对数据稀缺和工况变化时表现不佳,而基于元迁移学习的新方法则为解决这一问题提供了新的思路。本文提出的AC-MHSA-MTL方法通过引入非对称卷积和多头自注意力机制,有效提升了模型在复杂工况下的适应性与诊断能力。未来的研究可以进一步探索如何将该方法扩展到其他类型的水下设备故障诊断,以及如何结合更多先进的深度学习技术,以实现更高精度和更广泛适用性的故障诊断系统。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号