针对风力涡轮机异常检测的优化方法:整合不确定性量化与降维技术

《Electric Power Systems Research》:Optimized approach for wind turbine anomaly detection: integrating uncertainty quantification and dimensionality reduction

【字体: 时间:2026年02月11日 来源:Electric Power Systems Research 4.2

编辑推荐:

  异常检测三重困境的解决方案:提出贝叶斯优化随机森林与主成分分析融合的BPRF模型,通过贝叶斯模块量化不确定性,随机森林放大非线性特征,主成分分析降维提取正常子空间,实现高精度(F1 0.59)、高效率(AUC 0.86)的工业级风电机组异常检测。

  
邵恒岚|李海斌|李东升|包长春|卢书峰
内蒙古工业大学理学院,呼和浩特市,010051,中国

摘要

在风力涡轮机中准确检测异常对于运行稳定性至关重要,然而现有方法受到不确定性量化、高维复杂性和计算效率之间持续权衡的制约,这一挑战被称为“异常检测三难问题”。为了解决这个问题,我们提出了一种新颖的贝叶斯优化随机森林(BPRF)模型,该模型具有协同的三阶段架构。该框架首先使用贝叶斯模块生成概率特征,然后利用随机森林作为非线性放大器将数据映射到高维空间,最后应用主成分分析(PCA)来提取一个稳健的低维“正常”子空间以进行异常评分。在真实世界的公共数据集上进行验证后,BPRF模型在一系列主流基线方法中表现出色,获得了领先的F1分数0.59、准确率0.87和AUC 0.86。结果表明,BPRF模型有效规避了“异常检测三难问题”,提供了一种不仅准确而且可靠且计算上可行的解决方案,从而为实际工业应用树立了新的性能基准。

引言

随着全球对可再生能源的关注日益增加,作为清洁和可持续能源的风能发展迅速[1]。作为风能转换的核心组件,风力涡轮机的运行效率和安全性对整个风能系统的性能和可靠性至关重要[[2]]、[3]]、[4]]。然而,在长时间运行过程中,风力涡轮机容易出现各种故障,这不仅会导致设备停机,还会造成经济损失和安全风险[[5]]、[6]]、[7]]。因此,及时准确地检测和管理数据异常对于确保风能系统的稳定运行至关重要[[8]]、[9]]、[10]]。
在更广泛的工业资产领域,智能监控和异常检测已成为提高可靠性和降低故障成本的关键突破[[11]]、[12]]、[13]]、[14]]、[15]]。最近的研究通过多种方法推进了工业异常检测的发展。表1总结了这些代表性研究,涵盖了从深度学习框架到集成策略,并突出了它们的贡献和剩余的局限性。
尽管取得了这些显著进展,现有的数据驱动方法,无论是上述的先进模型[[16]]、[17]]、[18]]、[19]],还是经典的随机森林[20]和贝叶斯方法[21],在实际应用中通常面临一个严峻的挑战,本文将其称为“异常检测三难问题”[[22]]、[23]]、[24]]。理想的工业级检测系统必须同时满足三个核心要求:精确的不确定性量化(UQ)、有效管理高维复杂性以及高计算效率。然而,当前的方法往往只在这些领域中的一个或两个方面表现出色。追求精确UQ的贝叶斯或高斯过程方法[[25]]、[26]]、[27]]通常会因“维数灾难”[28,29]而面临高昂的计算成本。相反,计算效率高的机器学习模型虽然能够处理高维数据,但往往缺乏可靠的不确定性评估机制,这使得它们在复杂运行条件下容易产生不可信的误报或漏检[30,31]。尽管现有的混合模型已经取得了显著进展,但在这三个要求之间实现最佳平衡仍然是一个挑战,这表明还有改进的空间。
为了解决“异常检测三难问题”,本文提出了贝叶斯优化随机森林(BPRF)。与仅仅堆叠分类器(例如投票集成)或使用降维作为通用预处理步骤的传统混合模型不同,BPRF具有协同的“放大-提取”架构。它通过重新定义随机森林的角色作为非线性特征放大器,并在嵌入后使用PCA提取一个易于处理的“正常”子空间,最后通过贝叶斯模块量化不确定性。其主要贡献有三个方面:
  • 1.
    协同架构:提出了一种新的框架,将原始数据转换为稳健的、考虑不确定性的特征空间。这重新定义了随机森林(RF)和PCA的角色,超越了传统的分类或预处理,实现了结构特征放大和提取。
  • 2.
    效率-复杂性平衡:该设计有效弥合了高维表示和计算可行性之间的差距,确保模型足够轻量,适合工业应用。
  • 3.
    全面验证:
    在真实世界的监控控制和数据采集(SCADA)数据集上的广泛实验表明,BPRF建立了新的基准(F1分数0.59),成功提供了一种准确、可靠且计算效率高的解决方案。
  • 部分片段

    BPRF模型

    图1展示了所提出的BPRF模型的架构,详细说明了从初始输入到最终异常检测的数据流。整个过程被设计为一个系统化的管道,将原始数据转换为特征空间,在该空间中更容易识别异常。
    与仅仅堆叠算法进行决策级融合(例如投票集成)或使用降维作为标准预处理步骤的通用混合方法不同,BPRF被设计为一个紧密耦合的

    数据集介绍

    本研究的原始数据来自“CARE to Compare”数据集[32],这是一个包含来自三个风电场(A、B、C)的36台风力涡轮机89年运行记录的综合性SCADA存储库。虽然原始存储库包含95个不同案例(51个正常和44个异常),特征维度范围从86到957,但使用整个数据库可能会为特定故障诊断任务引入显著的冗余和计算开销。
    因此,为了确保

    结论与展望

    本研究介绍了BPRF模型,这是一种专门为解决风力涡轮机运行数据中的“异常检测三难问题”而设计的新型框架:即在稳健的不确定性量化、有效管理高维复杂性和高计算效率需求之间的持续权衡。我们的工作表明,BPRF的协同架构成功地打破了这些权衡,而不仅仅是简单地平衡它们。
    在真实世界上的实证验证

    结果复制

    如需复制案例研究的数据和材料,可向相应作者索取。

    伦理批准

    本文不包含任何由作者进行的涉及人类参与者或动物的研究。

    CRediT作者贡献声明

    邵恒岚:撰写——原始草稿、可视化、验证、软件、方法论、数据管理、概念化。李海斌:撰写——审稿与编辑、项目管理、资金获取。李东升:撰写——审稿与编辑、撰写——原始草稿、可视化、验证、监督。包长春:监督、项目管理、资金获取。卢书峰:监督、资金获取、正式分析。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号