基于深度金字塔卷积神经网络的电网故障诊断
《Frontiers in Physics》:Grid fault diagnosis based on the deep pyramid convolutional neural network
【字体:
大
中
小
】
时间:2025年10月24日
来源:Frontiers in Physics 2.1
编辑推荐:
传统电力电网故障诊断方法依赖人工经验,存在建模复杂、泛化能力不足等问题。本文提出基于深金字塔卷积神经网络(DPCNN)的智能故障诊断方法,构建端到端的故障分类模型和关键信息提取模型,直接从告警文本中挖掘隐含故障特征,实现高精度分类(最高达100%)和快速定位。实验表明,该方法在复杂场景和噪声数据下表现优异,故障识别率达99.5%,设备定位准确率98.7%,显著减少人工干预。
随着社会生产力的提升,对电力的需求持续增长,同时大规模接入新能源使得电网运行更加复杂,也增加了发生故障的风险。在这样的背景下,调度员必须迅速且准确地定位故障区域,并及时隔离,否则可能引发连锁故障,导致大规模停电甚至电网崩溃,从而造成严重的经济损失。电网故障诊断是控制故障发展的重要手段,通过分析监控系统收集的不同电气和非电气故障信息,判断故障区域并识别故障设备。目前常用的电网故障诊断方法包括专家系统、优化技术、Petri网、贝叶斯网络、模糊集合和分析模型等。这些方法主要基于故障机制和电网拓扑结构建立诊断模型,以实现对大部分故障的准确判断。然而,随着电网规模的扩大、结构的复杂化以及智能系统的发展,能量管理系统(EMS)获取的二次测量和监控数据呈现快速增长趋势,传统诊断方法难以直接处理如此庞大的报警信息,仍然依赖人工经验进行关键信息筛选,无法满足快速诊断的需求。因此,迫切需要开发一种智能故障诊断系统,以帮助调度员提高决策效率和准确性。
近年来,人工智能技术的快速发展推动了电网故障诊断的智能化转型。为了有效提取和表示来自大量EMS数据的深层故障特征,并开发用于EMS报警信息的端到端智能故障诊断方法,我们需要探索多种方法。本文提出了一种基于深度金字塔卷积神经网络(DPCNN)的电网故障诊断方法,直接处理报警信息文本,从而显著提升智能诊断水平和系统运行效率。该方法构建了端到端的故障分类模型和关键信息提取模型,直接从报警信息文本中挖掘隐含的故障特征,以实现故障类型的准确分类和故障设备的快速定位。此外,我们还结合了基于时间序列优先的故障设备识别策略,以进一步提高故障定位的准确性。
本文的主要贡献包括:首先,构建了一个端到端的故障诊断框架,通过建立两个故障分类模型和一个关键信息提取模型,实现了从报警信息文本到故障分类及设备识别的端到端诊断,从而显著减少人工干预。其次,利用DPCNN的金字塔结构和残差连接,有效提取报警信息的全局特征,解决了长文本依赖和梯度扩散问题,实现了高达100%的分类准确率。最后,设计了一种基于故障类型与时间序列特征融合的故障设备识别策略,通过区分简单故障和复杂故障,提升了故障设备定位的准确性。
现有故障诊断方法存在诸多问题。例如,基于规则的方法依赖于逻辑规则,当构建具有复杂逻辑关系的故障事件时,逻辑约束繁琐,知识表示困难,模型复杂度高。此外,大量报警信息需要筛选和分类,增加了建模工作量。基于数据驱动的方法虽然在处理电气量信息方面取得了一定成效,但大多未直接对EMS报警信息文本进行诊断研究,使得无法自动从故障案例中提取不同电网的特征差异。因此,本文提出的基于DPCNN的方法为电网故障诊断提供了新的技术路径。
在构建电网故障诊断框架时,报警信息文本的表示是关键。我们采用基于DPCNN的词向量矩阵方法,将每个报警语句转换为词向量矩阵A ∈ ?M × N,其中M是词语数量,N是每个词向量的维度。这种方法利用预训练的词嵌入(如word2vec),能够捕捉报警文本中的语义关系,从而实现对简单故障、开关故障和保护故障等关键故障类型的识别。然后,通过将词向量连接成句子向量,保留时间上下文和词语顺序,以处理来自SCADA系统的时序报警数据。
在文本表示方法方面,除了上述方法,还有诸如TF-IDF和BoW等其他方法。TF-IDF方法通过词语频率和语料库稀有性将文本部分表示为稀疏向量,计算简单,但无法捕捉语义关系或时间依赖性,限制了其在复杂报警文本中的有效性。BoW模型仅统计词语出现次数,不考虑顺序和上下文,同样不适用于区分需要时序信息的故障类型。而BERT等最新方法能够通过建模双向句子上下文实现更优的语义理解,但其高计算需求和对大规模标记数据集的依赖,使其在资源受限的电网控制中心难以实时应用。
DPCNN方法相较于这些方法具有显著优势。它利用预训练的嵌入,能够捕捉语义细微差别,实现对多种故障场景的稳健特征提取。与BERT相比,DPCNN计算效率更高,更适用于电网的实时故障诊断需求。同时,保留时间上下文使得DPCNN能够有效分析时序报警数据,而TF-IDF和BoW则忽略了词语顺序,难以处理复杂的报警信息。然而,DPCNN依赖于预训练嵌入的质量,这可能限制其在高度领域特定的故障模式中的表现。此外,对于非常长的文本,DPCNN的感知范围可能受到限制。因此,未来研究可以探索将DPCNN与GNN结合,以融合文本特征和拓扑特征,进一步提升复杂电网场景下的故障定位能力。
在本文提出的电网故障诊断框架中,DPCNN用于从报警文本信息中提取特征。DPCNN通过金字塔结构和残差连接,能够捕捉报警文本中的局部和长距离依赖关系,实现对隐含故障特征的稳健提取。实验结果表明,该方法在复杂电网场景和噪声数据环境中表现出色,最高故障分类准确率达到100%,能够有效识别多种故障类型,如简单故障、开关操作故障和保护操作故障。此外,我们还结合了基于时间序列优先的故障设备识别策略,以进一步提升故障定位的准确性。通过案例研究验证,我们的方法在故障识别率方面达到99.5%,在逐一排查后实现98.7%的准确定位,显著减少了人工干预,并在实际电网中具有高适用性。
在故障分类模型的设计中,我们构建了两个基于DPCNN的模型,用于对不同复杂度和故障设备类型的报警信息集进行分类。同时,我们还设计了一个基于DPCNN的关键信息提取模型,用于从报警文本中提取关键句子,进一步确定故障设备。根据故障分类结果,我们提出了融合故障类型和时间优先性的故障设备识别策略。例如,当分类结果为简单故障时,设备集合D中的设备被直接识别为故障设备;当分类结果为开关操作故障、发展故障或不完全保护操作故障时,设备集合D中的第一个设备被确定为故障设备;当分类结果为完全保护操作故障时,必须结合网络拓扑结构来确定故障设备。
为了验证所提出方法的有效性,我们进行了实验分析。实验数据和评估指标方面,我们选择了某一地区的实际电网和TS2000仿真系统作为数据来源,获取了样本数据。实际电网包含731个发电站和变电站,5382条线路,以及从0.22 kV到500 kV的13个电压等级。TS2000仿真系统则包含60个发电站和变电站,825条线路,以及从10 kV到500 kV的5个电压等级。这些电网的报警信息样本具有不同的描述方式,其中实际电网的报警信息包含更多非故障信息,具有高噪声和简单描述的特点;而TS2000仿真系统的报警信息则更详细,具有较低噪声和高描述性的特点。
在模型参数设置方面,我们使用Python编程语言,在PyCharm开发环境中基于TensorFlow深度学习框架构建了DPCNN模型。为了确保模型的最佳分类性能,我们根据样本数据调整了主要参数,如卷积核大小(kernel_size)、卷积核数量(num_filters)和输入序列长度(seq_length),以分析不同参数值对模型F1值的影响。最终,我们确定了故障分类模型的参数设置:卷积核大小为3,卷积核数量为200,输入序列长度为80;关键信息提取模型的参数设置为卷积核大小3,卷积核数量150,输入序列长度为6。其他参数则根据模型性能和计算速度进行调整。
实验结果表明,所提出的方法在分类准确率和故障识别率方面表现优异。通过5折交叉验证,我们重新评估了模型,并计算了95%置信区间(CIs)。分析结果显示,三个模型的平均准确率分别为99% ± 0.8%、98% ± 1.0%和99% ± 0.7%,置信区间分别为[97.5, 99.9]、[96.2, 99.5]和[97.3, 99.8]。这些结果进一步验证了模型的稳健性,表明即使初始分类准确率达到100%,模型在实际电网故障诊断中的可靠性也得到了保障。
为了评估模型在噪声数据环境中的表现,我们使用了高噪声区域电网数据集,该数据集包含重复和延迟的报警信号。在该数据集上,故障分类模型1和2以及关键信息提取模型的准确率分别为97%、96%和97%。这些结果表明,DPCNN具有较强的鲁棒性,能够有效处理噪声报警日志,增强其在实际电网故障诊断中的实用性。
此外,我们对DPCNN模型与其他模型(如CNN和BPNN+TF-IDF)进行了比较。结果表明,DPCNN模型在分类准确率方面显著优于CNN和BPNN+TF-IDF模型。特别是在分类类别增多时,CNN和BPNN+TF-IDF模型的准确率有所下降,而DPCNN模型则保持较高的性能。这表明,DPCNN模型在处理复杂故障类型和大规模报警数据方面具有更强的适应性和稳定性。
在具体案例验证方面,我们对实际故障案例和仿真系统中的故障案例进行了分析。例如,在实际故障案例中,Weishan变电站的Luolian D151线路发生故障,报警信息集如图S1所示。通过故障分类模型1和2,我们确定了故障类型为简单线路故障。关键信息提取模型从报警信息集中提取出关键信息句子,进一步确定了可疑故障设备集。最终,根据故障分类结果,我们确认了故障设备为Luolian D151线路,与实际故障设备一致,诊断结果正确。在TS2000仿真系统中,Yane线路在Emei变电站发生永久性ABC三相故障,且2254号断路器未能操作。报警信息集如图S2所示,通过故障分类模型1和2,我们确定了故障类型为线路故障和开关操作故障。关键信息提取模型从报警信息集中提取关键信息句子,并确定可疑故障设备集。结合网络拓扑分析,我们进一步缩小了可疑故障设备的范围,最终确认了故障设备为Emei变电站的220 kV Yane线路,与实际故障设备一致,诊断结果正确。
综上所述,本文提出的基于DPCNN的电网故障诊断方法在处理报警信息文本和识别故障设备方面具有显著优势。通过构建端到端的故障分类模型和关键信息提取模型,该方法能够直接从报警信息文本中挖掘隐含的故障特征,实现故障类型的准确分类和故障设备的快速定位。此外,结合时间序列优先的故障设备识别策略,进一步提升了故障定位的准确性。实验结果表明,该方法在复杂电网场景和噪声数据环境中表现出色,具有高适用性。尽管在完全保护操作故障和开关操作故障的诊断中仍需依赖网络拓扑分析,但其在复杂条件下的故障设备识别准确率较高,具有较高的应用价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号