温度对盐洞稳定性和可存性的影响:蠕变现象的作用

《Journal of Energy Storage》:Temperature influence on the stability and the viability of salt caverns due to creep phenomena

【字体: 时间:2025年08月09日 来源:Journal of Energy Storage 9.8

编辑推荐:

  可解释强化学习与数学优化结合的两层框架有效解决了电池交换站(BSS)能量管理的可扩展性、不确定性和安全决策问题,通过状态荷电量分组降低计算复杂度,确保15分钟内完成3200充电桩的调度,平衡电力成本、电池寿命和收益。

  电池更换站(Battery Swapping Stations, BSS)在推动电动汽车(Electric Vehicles, EV)普及方面扮演着至关重要的角色。随着电动汽车的快速发展,传统充电方式因耗时较长而逐渐成为制约因素,而BSS通过快速更换电池,显著提升了充电效率。此外,BSS作为能源存储系统,能够根据能源价格波动调整内部电池的充放电策略,从而参与需求响应(Demand Response, DR)市场和备用市场,提高经济效益并保障电力系统的安全稳定运行。然而,当前BSS的能源管理仍然面临诸多挑战,如系统的可扩展性、环境不确定性、决策安全性以及快速响应能力等。

可扩展性是BSS的一个关键特性,主要受到两个因素的影响:一是随着电动汽车保有量的增长,BSS需要不断扩展容量;二是BSS充电基础设施本身存在操作上的不确定性,频繁地在运行、维护和关闭状态之间切换。这种可扩展性不仅体现在物理设备的数量上,也体现在系统运行时的动态变化中。因此,如何设计一种能够适应BSS规模变化的能源管理方法,成为研究的重点之一。

环境不确定性主要来源于能源价格的波动和电池需求的变化。能源价格的不确定性使得BSS在制定充放电策略时难以准确预测成本,而电池需求的不确定性则增加了调度的复杂性。在这样的环境下,传统的数学优化(Mathematical Optimization, MO)方法虽然能够处理部分问题,但由于其依赖于预定义的系统模型,难以应对动态变化的不确定性,从而限制了其在实际中的应用效果。与此同时,深度强化学习(Deep Reinforcement Learning, DRL)虽然在处理不确定性方面表现出色,但其依赖于复杂的神经网络结构,难以在可扩展的BSS中实现高效的决策过程。

为了确保BSS调度策略的安全性,许多研究引入了安全强化学习(Safe Reinforcement Learning, Safe RL)方法。Safe RL通常被建模为受限马尔可夫决策过程(Constrained Markov Decision Process, CMDP),旨在在优化过程中满足特定的安全约束。然而,现有的Safe RL方法多适用于静态约束条件,难以应对BSS中频繁变化的运行环境。此外,这些方法往往依赖于深度神经网络(Deep Neural Networks, DNNs),其内部机制缺乏透明性,导致决策路径难以解释,从而影响了其在实际应用中的可接受性。

解释性强化学习(Explainable Reinforcement Learning, XRL)作为一种新兴的方法,能够提供清晰的决策路径和明确的决策结果,使人类能够理解其运作机制,从而确保决策的安全性。XRL在一些安全关键领域已有成功应用,例如交通信号控制和建筑能源管理。然而,在面对复杂的高维问题时,XRL仍然存在一定的局限性。复杂问题通常需要更复杂的网络结构,这可能会降低决策路径的清晰度和决策边界的明确性,使得XRL难以在大规模BSS能源管理中广泛应用。

针对上述问题,本文提出了一种结合XRL与MO的两层优化框架,并引入了基于电池荷电状态(State of Charge, SoC)的分组策略,旨在实现大规模BSS在不确定环境下的快速且安全的调度。该框架通过将BSS的能源管理问题分解为两个层次:上层XRL控制器负责在不确定性环境下生成总功率和备用功率的可解释决策,下层MO控制器则将总功率按分组方式分配到各个充电堆。这种设计不仅避免了XRL在空间维度上的探索,提高了优化效率,还确保了系统能够适应BSS的可扩展性。

在上层控制器中,我们采用近端策略优化(Proximal Policy Optimization, PPO)算法,并结合可解释的连续控制树(Interpretable Continuous Control Tree, ICCT)构建了可解释PPO(XPPO)。XPPO的设计确保了上层控制器在决策过程中具备可解释性,同时避免了因复杂网络结构带来的决策路径模糊问题。XPPO的输出不仅影响BSS的总功率和备用功率,还通过将这些信息传递给下层MO控制器,实现对各个充电堆的功率分配。

在下层控制器中,我们将功率分配问题建模为混合整数二次规划(Mixed Integer Quadratic Programming, MIQP)问题。MIQP作为一种安全且精确的优化方法,能够有效处理BSS中的非线性约束条件。通过引入基于电池SoC的分组策略,我们减少了MIQP问题中的决策变量数量,从而提高了求解速度。此外,MIQP中的变量设计能够自动与BSS中正在工作的电池数量相联系,使得系统能够灵活适应BSS的可扩展性需求。

为了验证所提出方法的有效性,本文进行了模拟实验。实验结果表明,即使在包含3200个充电堆的BSS中,所提出的方法仍能在15分钟内完成能源管理任务。这不仅展示了方法在大规模系统中的高效性,还证明了其在不确定环境下的适用性。同时,该方法确保了决策路径的透明性和简洁性,提供了可解释且安全的调度方案,同时保持了与现有方法相当的运营成本。

在算法设计方面,本文提出了上层和下层控制器的协同机制。上层控制器通过采样环境并利用XPPO生成总功率和备用功率,而下层控制器则接收这些信息,并将其分解为各个充电堆的具体功率分配。这种协同机制使得整个系统能够在保证决策安全的前提下,实现快速响应和高效优化。此外,为了进一步提高系统的适应性,本文还考虑了BSS中充电堆数量的动态变化,确保所提出的方法能够在不同规模的BSS中灵活应用。

本文的数据集和参数设置基于实际工程经验。BSS系统的模型结构如图1所示,其参数如表1所示。其中,电池老化系数的计算基于电池单元价格的假设,即约为7美元/瓦时。在模拟实验中,能源市场价格和备用市场价格来源于PJM(美国东部电力市场),这使得实验结果更具现实意义。此外,本文还考虑了能源市场与备用市场的价格差异,即出售能源的价格为购买价格的80%,这一设定反映了实际市场中的价格机制。

本文的研究成果表明,结合XRL与MO的两层优化框架能够有效应对BSS在可扩展性、不确定性、安全性和快速决策方面的挑战。该框架不仅提高了BSS能源管理的效率,还确保了决策的透明性和安全性。通过引入基于SoC的分组策略,系统能够在面对大规模BSS时保持较高的运行效率,同时避免了因复杂网络结构带来的决策路径模糊问题。此外,本文提出的XPPO和MIQP方法在实际应用中表现出良好的适应性和灵活性,能够应对不同规模和运行条件下的BSS需求。

在实际应用中,BSS的能源管理不仅关系到运营成本的优化,还直接影响到系统的安全性和稳定性。因此,如何在保证经济效益的同时,确保系统的安全运行,是BSS能源管理研究的核心问题之一。本文所提出的方法通过引入可解释性机制和分组策略,有效平衡了效率与安全之间的关系,为大规模BSS的能源管理提供了新的思路和解决方案。

综上所述,本文的研究成果为BSS能源管理提供了重要的理论支持和实践指导。通过构建两层优化框架,结合XRL与MO的优势,本文不仅解决了BSS在面对不确定性时的调度难题,还确保了决策过程的安全性和透明性。这一方法的应用有望推动BSS在电动汽车普及中的进一步发展,为构建更加智能、高效和安全的交通能源系统提供有力支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号