
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大模型嵌入深度强化学习的多频段电力系统稳定器高精度控制研究
【字体: 大 中 小 】 时间:2025年05月27日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对高渗透率分布式能源并网导致的多频段电力系统稳定器(MB-PSS)控制难题,研究人员创新性地提出注意力嵌入Transformer深度确定性策略梯度算法(ATDDPG)。该研究将大模型/Transformer机制融入DDPG框架,通过自适应更新PID参数实现系统故障下转子角偏差降低10.94%、电压稳定时间缩短12.54%,ITAE指标较传统DDPG优化26.30%,为新能源电力系统稳定控制提供了兼具自适应性与高精度的解决方案。
随着中国"碳中和"目标的全面推进,电力行业正加速构建以可再生能源为主体的新型电力系统。然而,高渗透率分布式新能源并网带来的强波动性,使得多频段电力系统稳定器(Multiband Power System Stabilizer, MB-PSS)的稳定控制面临严峻挑战。传统PID控制虽精度较高但参数固化,难以适应系统运行状态变化;深度强化学习(Deep Reinforcement Learning, DRL)虽具自适应优势却存在收敛慢、精度不足等问题。这一矛盾严重制约着含高比例可再生能源电力系统的安全运行。
针对这一关键问题,广西某高校的研究团队在《Engineering Applications of Artificial Intelligence》发表创新成果,提出注意力嵌入Transformer深度确定性策略梯度算法(Attention-embedded Transformer Deep Deterministic Policy Gradient, ATDDPG)。该研究通过三大技术创新:将PID控制框架与深度确定性策略梯度(DDPG)结合实现参数自适应更新;在DDPG双网络架构中嵌入大模型/Transformer扩大输入维度;引入注意力机制强化关键信息提取,最终在双区域四机系统中实现三相接地故障等工况下转子角偏差降低10.94%,电压稳定时间缩短12.54%,ITAE指标较传统DDPG优化26.30%。
关键技术方法包括:基于两区域四机系统的仿真平台构建;融合注意力机制的Transformer模块设计;串联多组Actor-Critic网络架构;采用时间乘误差积分(ITAE)等指标量化控制性能;通过三相接地故障、相间故障等典型场景验证算法鲁棒性。
【结构及数学模型】
研究首先建立包含三个独立频段的MB-PSS典型模型,其传递函数可表征不同频段的动态响应特性。数学模型分析表明,新能源波动会显著影响低频振荡模态,这为后续控制算法设计提供了理论依据。
【ATDDPG算法设计】
创新性地在DDPG的Actor-Critic网络中嵌入Transformer编码器层,利用自注意力机制动态加权输入状态特征。其中Critic网络采用时间差分学习评估动作价值,Actor网络则通过策略梯度更新PID参数。特别设计的注意力转移模块有效缓解了网络间信息丢失问题,实验显示该结构使训练效率提升38.7%。
【案例研究】
在MATLAB 2023b仿真环境中,对比实验表明:1)在三相接地故障场景下,ATDDPG将转子角主动偏差峰值控制在0.128 rad,较DDPG降低10.94%;2)电压恢复至稳态值0.99 p.u.所需时间仅为2.36秒,比优化算法快12.54%;3)ITAE指标达到76.32,显著优于传统方法的103.52。值得注意的是,简化版Transformer在普通CPU设备即可实现实时控制,具备工程应用可行性。
研究结论指出,ATDDPG首次实现大模型与DRL在电力控制领域的融合创新,通过"数学建模+数据驱动"双轮驱动策略,既保留了PID的控制精度优势,又赋予系统参数自适应性。讨论部分强调,该方法为高比例可再生能源并网下的系统稳定控制提供了新范式,其模块化设计可扩展至其他电力电子设备控制场景。未来研究将探索更深层Transformer网络在广域测量系统中的应用,以进一步提升大电网全域稳定控制能力。
生物通微信公众号
知名企业招聘