《Engineering Applications of Artificial Intelligence》:From augmentation to translation: Data generation by conditional hierarchical variational autoencoder, enhancing monitoring mooring systems in floating offshore wind turbines
【字体:
大中小
】
时间:2025年10月31日来源:Engineering Applications of Artificial Intelligence 8
尽管FOWT前景广阔,但准确模拟其行为和监测其系泊系统的状况仍然是一个主要挑战,特别是在开发这些系统的数字孪生(DT)方面(Longman et al., 2023)。由于安装的平台数量有限,难以收集足够的数据,特别是损坏状态下的数据。此外,使用物理模型模拟系泊系统行为既计算密集又容易产生不确定性。解决这些挑战需要创新的方法,以全面理解和管理FOWT的系泊系统。
在类不平衡的SHM问题中,集成一个焦点损失优化的CNN分类器与VAE-GAN基础的增强,提出了一种新的方法称为VGAIC-FDM,以提高在不平衡数据存在时的故障识别。结果呈现出高水平的诊断准确性和F1分数(Li et al., 2024)。Zhao et al. (2022)开发了归一化条件VAE与自适应焦点损失(NCVAE-AFL)框架,以提高在类不平衡结构健康监测挑战中的少数类诊断效率。 Li and Betti (2023)引入了一种创新的数据增强系统,利用条件VAE架构提供cepstral系数作为响应特征。
上述论文仅提出了旨在缓解深度学习基于损坏识别和分类中类不平衡问题的技术。然而,VAE尚未应用于生成真实规模的时间序列少数数据。此外,DGMs仅基于少数数据的分布进行训练,使用了少数类的信息。最近的一项研究表明,DGMs可以通过利用多数数据集来增强少数数据。在此背景下,Ai et al. (2023)提出了一种目标函数,允许VAEs通过利用基于多数的先验来增强少数数据。我们提出了一种新的条件分层变分近似,用于参数化扩散过程,旨在通过利用多数和少数数据的特征来构建少数数据分布。分层VAE(HVAE)通过引入多个随机潜变量或分布改进了VAE架构(Havtorn et al., 2021)。扩散过程代表了一种随机机制,通过时间逐步改变数据(Sohl-Dickstein et al., 2015)。我们提出的CHVAE方法采用两阶段预训练-微调训练框架,以在各种环境和操作条件下从健康状态(多数数据)生成和增强真实规模的损坏状态时间序列(少数数据)。
本研究提出了一种新的框架,该框架利用条件变分自编码器(CVAE)算法和扩散概率模型(DPM)的原理,重建少数数据的潜在分布,从而基本上促进了基于领域转换的实时监测系统的创建。在这一框架中,预训练阶段是在多数类上进行的,其中多数类包括源系泊系统的健康数据。所提出的VAE的可训练权重通过公式(1)进行优化。在训练过程中,第一个解码器学习重建标准化输入数据,同时第二个条件解码器学习重建和估计来自条件潜在空间的对应去标准化参数。为了验证CHVAE的性能,我们采用MNIST基准图像数据集作为下游应用,评估其在多种类不平衡场景下的表现。此外,我们保持与Ai et al. (2023)相同的条件和多类分类模型,以确保公平比较。
本文的实验部分包括以下内容:首先,我们评估CHVAE的数据增强质量,将其应用于MNIST基准图像数据集的多类分类任务,作为下游应用。其次,我们将所提出的框架与MGVAE进行比较,MGVAE由Ai et al. (2023)提出。第三,我们应用CHVAE来构建基于领域转换的实时监测系统,以处理浮动海上风力涡轮机(FOWT)的不同系泊系统。
为了确保公平比较,我们在预训练和微调过程中使用了与Ai et al. (2023)中使用的MGVAE相同的VAE架构。此外,我们还实施了基于CNN的VAEs用于CHVAE。通过这一实施,我们能够生成多样化的少数类数据,这在挑战性条件下尤为重要。
为了评估CHVAE的性能,我们采用了视觉、统计和行为方法。通过这些方法,我们比较了CHVAE生成的数据与模拟数据在各种条件下的相似性。此外,我们还通过FID损失函数和MSE(重建误差)评估了生成数据与原始数据之间的相似性,这些数据由OC4平台的数值模型(Robertson et al., 2014b)通过OpenFast模拟得出。在评估中,我们考虑了不同的海况,以反映激励的随机性和未检测到的损坏严重程度。生成的记录在未观察到的海况和损坏严重程度下表现出与真实行为的相似性,这说明了CHVAE在零样本、实时损坏识别中的多功能性。
在类不平衡的SHM问题中,结合焦点损失优化的CNN分类器与VAE-GAN基础的增强,提出了一种新的方法称为VGAIC-FDM,以提高在不平衡数据存在时的故障识别。结果呈现出高水平的诊断准确性和F1分数(Li et al., 2024)。 Zhao et al. (2022)开发了归一化条件VAE与自适应焦点损失(NCVAE-AFL)框架,以提高在类不平衡结构健康监测挑战中的少数类诊断效率。 Li and Betti (2023)引入了一种创新的数据增强系统,利用条件VAE架构提供cepstral系数作为响应特征。
上述论文仅提出了旨在缓解深度学习基于损坏识别和分类中类不平衡问题的技术。然而,VAE尚未应用于生成真实规模的时间序列少数数据。此外,DGMs仅基于少数数据的分布进行训练,使用了少数类的信息。最近的一项研究表明,DGMs可以通过利用多数数据集来增强少数数据。在此背景下,Ai et al. (2023)提出了一种目标函数,允许VAEs通过利用基于多数的先验来增强少数数据。我们提出了一种新的条件分层变分近似,用于参数化扩散过程,旨在通过利用多数和少数数据的特征来构建少数数据分布。分层VAE(HVAE)通过引入多个随机潜变量或分布改进了VAE架构(Havtorn et al., 2021)。扩散过程代表了一种随机机制,通过时间逐步改变数据(Sohl-Dickstein et al., 2015)。我们提出的CHVAE方法采用两阶段预训练-微调训练框架,以在各种环境和操作条件下从健康状态(多数数据)生成和增强真实规模的损坏状态时间序列(少数数据)。
本研究提出了一种新的框架,该框架利用条件变分自编码器(CVAE)算法和扩散概率模型(DPM)的原理,重建少数数据的潜在分布,从而基本上促进了基于领域转换的实时监测系统的创建。在这一框架中,预训练阶段是在多数类上进行的,其中多数类包括源系泊系统的健康数据。所提出的VAE的可训练权重通过公式(1)进行优化。在训练过程中,第一个解码器学习重建标准化输入数据,同时第二个条件解码器学习重建和估计来自条件潜在空间的对应去标准化参数。为了验证CHVAE的性能,我们采用MNIST基准图像数据集作为下游应用,评估其在多种类不平衡场景下的表现。此外,我们保持了与Ai et al. (2023)相同的条件和多类分类模型,以确保公平比较。