基于零阶优化的频率稳定约束最优潮流:一种免解析梯度的交互式调度新方法

《IEEE Potentials》:Security-constrained optimal power flow via zeroth-order optimization

【字体: 时间:2025年12月22日 来源:IEEE Potentials CS1.3

编辑推荐:

  为解决传统数据驱动方法在求解频率稳定约束最优潮流时存在大量冗余仿真计算、效率低下的问题,研究人员开展了基于零阶优化(ZO)算法的研究。该研究通过零阶梯度估计技术,将非解析的频率稳定仿真校验与最优潮流模型进行交互式优化,实现了调度方案的实时梯度反馈与迭代修正。结果表明,该方法在保证频率安全的同时,将系统运行成本降低了1.23%,计算效率提升了96.48%,为高比例新能源接入下的电网安全经济运行提供了高效解决方案。

  
随着电力系统向碳中和目标转型,其运行模式日益复杂,频率稳定问题日益凸显。传统的频率稳定约束调度方法主要分为解析建模和数据驱动两类。解析建模方法(如基于系统频率响应SFR模型)虽然计算效率较高,但难以精确刻画复杂的频率动态响应过程,且通常将功率扰动简化为阶跃函数,难以适应短路故障等时变扰动场景。数据驱动方法(如基于深度神经网络DNN)虽然能更准确地捕捉频率响应特性,但通常需要海量的离线仿真数据来拟合频率稳定边界,导致计算资源浪费严重。据统计,在传统数据驱动方法中,仅有约3.64%的仿真数据对刻画频率稳定边界有效,其余96.36%的仿真计算均为冗余,极大地降低了计算效率。
为了克服上述挑战,研究人员提出了一种全新的思路:不再试图将非解析的频率稳定约束显式地转化为解析表达式,而是利用零阶优化(Zeroth-Order Optimization, ZO)这一可解释的机器学习方法,直接探索频率稳定仿真校验的梯度信息。零阶优化是梯度下降方法的一种变体,它无需目标函数的解析表达式,仅通过函数值(即仿真输出结果)即可估计梯度方向。基于此,研究人员构建了最优潮流与频率稳定仿真校验之间的交互式优化框架。在该框架下,调度方案首先由最优潮流模型确定,并输入到频率稳定仿真系统中进行校验;仿真系统将校验结果(如频率最低点fnadir)反馈给优化模型;零阶优化算法根据反馈结果估计梯度,并指导调度方案沿梯度下降方向进行迭代修正,直至找到满足经济最优和频率安全双重约束的最优解。
主要关键技术方法
本研究主要采用了零阶优化(ZO)算法来求解嵌入频率稳定仿真校验的最优潮流模型。首先,将包含非解析频率稳定约束的最优潮流问题通过罚函数法转化为无约束优化问题。然后,利用多采样点估计方法,通过在当前调度方案附近进行多次仿真采样,估计目标函数的梯度。为了降低梯度估计的方差,采用ZO-sign算法对估计的梯度进行符号化处理。最后,通过梯度下降法迭代更新调度方案,并利用外点法动态调整罚因子,确保最终解满足所有约束条件。
研究结果
1. 零阶优化迭代过程验证
在IEEE-9节点系统中,以不考虑频率稳定约束的最优潮流解作为初始值,通过33次迭代,发电机出力及系统运行成本逐渐收敛。最优解对应的发电机1、2、3出力分别为95.16 MWh、101.84 MWh和118.00 MWh,系统运行成本为5726.66美元。在迭代过程中,发电机出力并非单调变化,而是存在波动,这是由于零阶优化估计的梯度存在偏差所致,但这并不影响最终收敛到最优解。
2. 调度方案轨迹分析
通过重采样生成484个调度方案点,绘制了调度方案在迭代过程中的移动轨迹。结果显示,调度方案从初始点出发,经过多次迭代,最终到达频率稳定边界上的最优点。这验证了最优解通常位于可行域的边界或顶点上的定理。
3. 零阶优化方法最优性验证
通过分析罚函数和频率最低点fnadir的迭代过程,验证了最优解位于频率稳定边界内。在迭代初期,由于fnadir远低于49.75 Hz的限值,罚函数值较大;随着迭代进行,fnadir逐渐接近并达到49.75 Hz,罚函数迅速下降至0。此外,通过对比最优解S1与附近随机生成的调度方案S2-S5的频率仿真曲线,发现S1方案下的fnadir恰好为49.75 Hz,而其他方案均存在一定的安全裕度,表明S1方案在保证频率安全的前提下实现了经济最优。
4. 零阶优化方法与传统数据驱动方法对比
将本文提出的零阶优化方法(M1)与传统的基于混合整数线性约束(MILC)的数据驱动方法(M2)进行对比。结果表明,M1方法得到的系统运行成本为5726.66美元,比M2方法的5798.02美元降低了1.23%。在计算效率方面,M1方法仅需99次仿真计算,而M2方法需要2500次仿真计算,M1方法的计算效率提升了96.48%。这验证了零阶优化方法在保证解的质量的同时,能够有效避免大量冗余的仿真计算。
5. 学习率对迭代效率的影响
研究了学习率参数对迭代效率的影响。结果表明,学习率参数对迭代效率有较大影响。过快的下降速度(C1、C2和m过大)或过慢的下降速度(C1、C2和m过小)都会导致迭代次数增加。但即使在最差情况下,迭代次数也在250次以内,计算效率仍比传统数据驱动方法提升70%以上。
6. 大系统可扩展性分析
在IEEE-39节点系统和改进的PEGASE-89节点系统上验证了方法的可扩展性。在IEEE-39系统中,经过53次迭代,罚函数降至0,系统运行成本为60777.14美元。在改进的PEGASE-89系统中,经过78次迭代,罚函数降至0,系统运行成本为114859.52美元。通过对比最优解与附近随机调度方案的成本,验证了所得解的经济最优性。
7. 零阶优化与传统梯度估计方法对比
将零阶优化方法与传统的有限差分法进行对比。在IEEE-9、IEEE-39和改进的PEGASE-89系统中,零阶优化方法所需的仿真次数分别比有限差分法减少了74.22%、97.35%和97.00%。对于高维变量系统(如IEEE-39和PEGASE-89),有限差分法即使达到最大迭代次数(300次)也无法找到满足频率安全约束的最优调度方案,而零阶优化方法则能有效求解。
研究结论与讨论
本研究成功提出并验证了一种基于零阶优化(ZO)的求解频率稳定约束最优潮流的新方法。该方法的核心创新在于,通过零阶梯度估计技术,将非解析的频率稳定仿真校验与最优潮流模型进行交互式优化,实现了调度方案的实时梯度反馈与迭代修正。
研究结论表明,该方法具有显著优势。首先,在解的质量方面,该方法能够找到满足频率安全约束的经济最优解,且系统运行成本低于传统数据驱动方法。其次,在计算效率方面,该方法通过避免大量冗余的仿真计算,将计算效率提升了96.48%。最后,该方法具有良好的可扩展性,能够有效应用于大规模电力系统。
然而,研究也指出了未来需要深入研究的两个挑战。一是如何在对估计梯度进行修正时,既能保证计算效率,又能降低梯度估计的方差。二是如何进一步研究学习率的选择策略,以提高迭代效率,这是梯度下降算法中普遍存在的问题。
综上所述,该研究为解决电力系统频率稳定约束调度问题提供了一种高效、精确的解决方案,为高比例新能源接入下的电网安全经济运行提供了重要的理论支撑和技术手段。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号