《Computation》:An Interpretable Artificial Intelligence Approach for Reliability and Regulation-Aware Decision Support in Power Systems
编辑推荐:
本综述系统性地提出了CRITAIR(基于可解释人工智能建议的关键性分析)框架,旨在解决中压(MV)配电网可靠性预测与监管决策的融合难题。该框架创新性地结合了TabNet预测模型、代理检索增强生成(Agentic RAG)技术及可解释推理图谱,实现了对系统平均中断频率指数(SAIFI)的高精度预测,并确保了决策过程的透明性与可审计性。文章通过真实运营数据验证了其在保持与随机森林(Random Forest)、XGBoost相媲美的预测性能的同时,能够提供全局与局部特征归因,并将分析结果与RETIE、NTC 2050等法规条款相关联,为受严格监管的电力公用事业数字化转型提供了兼具预测准确性、解释性和法规遵从性的端到端解决方案。
现代中压(MV,1–36 kV)配电网在资产老化、气候多变和需求增长等异质且不断演变的条件下运行,这些因素侵蚀了供电连续性,进而影响了系统级的可靠性指标。提升这些指标是配电公司提高供电质量的核心目标。国际上通常采用IEEE Std 1366标准化的系统平均中断持续时间指数(SAIDI)和系统平均中断频率指数(SAIFI)来评估可靠性。在哥伦比亚,这些标准通过能源与天然气监管委员会(CREG)建立的监管框架具体实施。
相关研究进展
可靠性预测的研究已从传统的统计方法发展到适用于表格和异构数据的现代深度学习架构。早期线性模型计算成本低、易于解释,但其严格的线性结构限制了其模拟电网组件间复杂相互作用以及纳入降水、阵风强度等外生驱动因素的能力。非线性模型,如k近邻和支持向量回归(SVR),提供了改进的表达能力,但在处理高维数据时面临可扩展性挑战。基于树的集成方法,特别是随机森林和XGBoost,通过模拟非线性相互作用和高阶特征依赖,展现了卓越的预测精度,但其有限的可解释性在需要透明度和可审计性的受监管公用事业环境中构成障碍。
深度神经网络(DNN)在处理大型中断日志并结合高分辨率气象、植被和资产状态数据时,实现了预测中断频率、持续时间和恢复时间的最新性能。然而,其固有的“黑箱”表征使得在高风险操作环境中难以辩解。TabNet是一种专为表格数据设计的深度学习架构,它通过稀疏注意力和序列特征选择,同时提供全局和局部可解释性,使其特别适合中压网络的可靠性研究。
在决策支持方面,早期依赖于基于大语言模型(LLM)的问答系统,但其存在幻觉和缺乏可追溯性问题。检索增强生成(RAG)架构通过结合语义检索和接地文本生成,减少了幻觉并提高了事实一致性。代理RAG和多代理RAG架构进一步引入了自主代理进行多步推理,能够协调多个工具集成异构证据。知识图谱(KG)通过显式表示实体、属性和关系,实现了结构化推理,增强了可解释性。
材料与方法
研究构建了一个全面的数据集,包含来自CHEC(中央卡尔达斯水电公司,EPM集团的一部分)从2019年1月1日到2024年6月30日的统计记录。数据集基础是中断记录,随后丰富了详细的网络资产结构信息,并通过时空查询整合了外生变量,包括气候变量(如降水量、气压、湿度、风速等)、闪电活动数据和植被存在数据。为了解决故障诊断的复杂性,数据集通过下游网络追踪算法重构为组件级表格,每个记录对应一个候选故障资产。
作为回归基线,评估了普通最小二乘法(OLS)及其正则化形式(如LASSO和ElasticNet)。随机森林通过聚合决策树集合的预测提供非线性建模能力。XGBoost以阶段方式构建加法模型,通过梯度提升优化性能。深度学习方法采用TabNet,其核心机制是一系列决策步骤,使用注意力选择稀疏的特征子集。TabNet的预测通过参数化映射生成,并利用其注意力机制进行局部相关性分析,生成特征重要性排名。
对于基于RAG的生成代理,评估了范围广泛的仅解码器LLM,包括专有API模型和开源可本地部署的模型。系统采用代理RAG范式,将LLM重新定义为能够推理、规划和行动的代理。代理配备了一系列工具,可以与环境交互,执行多步推理过程,并生成基于检索证据的、可验证的回答。
CRITAIR框架集成
CRITAIR框架采用模型-视图-控制器(MVC)架构模式,集成了诊断分析界面和预测推荐引擎。用户通过交互式过滤器选择地理区域和时间窗口,系统渲染相应的MV-L2网络并列出该时段内记录的中断事件。用户选择事件后,控制器调用下游追踪算法识别所有电气连接的候选组件。
这些候选组件的信息被结构化为粒度化的根本原因数据库模式,并输入到基于TabNet的预测模型中。该模型有两个同步目标:估计每个资产的质量指数以量化其对服务退化的预期贡献,并导出事后特征相关性。对于每个选定的资产,获得重要性排名,并保留五个最有影响力的结构性和外生变量。这些精炼信息成为基于LLM的推荐代理的主要输入。
代理启动代理RAG过程,利用包含RETIE、NTC和CHEC内部规范的专业文档语料库,自主制定查询。该语料库通过一组资产特定的结构化转换文档得到增强,这些文档将结构性和外生变量映射到每个非结构化源的特定部分。代理发出有针对性的查询,按条款和数字标识符过滤,在检测到差距时扩展术语,并仅推广在独立来源间得到证实且措辞和范围一致的证据。这确保了分析不仅由预测信号驱动,而且牢固地植根于既定的监管和工程标准。
为了确保完全透明和可审计性,整个决策路径被合成为一个结构化的、可解释的推理图。该图作为诊断过程的正式记录,映射了TabNet模型的初始预测输出、检索到的监管证据以及LLM代理采取的中间推理步骤。每个节点代表一个信息单元(如优先考虑的资产、有影响的变量或特定的监管条款),而边则对它们之间的逻辑关系进行编码。每个节点和边都存储了源标识符、文档版本和章节锚点,提供端到端的证据归因。作为最终输出,系统发布一个连贯且可追溯的自然语言推荐,并附有推理图和相应的监管引用。
实验结果与讨论
在预测性能方面,TabNet在时间感知滚动窗口配置下表现出对时间漂变的强大韧性,获得了最高的方差解释(R2= 0.83)和最低的绝对误差(MAE = 3.5×10-4)。在随机拆分场景下,TabNet达到峰值性能(R2= 0.93, MSE = 1.5×10-5),优于XGBoost(R2= 0.86)。这种聚合性能在更细的分辨率下得到证实,在SAIFI贡献最高的城市和馈线级别,TabNet始终优于或匹配基准模型。
在特征归因方面,全局特征重要性分析显示,评估的模型在确定负荷密度(CNT_TRAFOS_AFEC)和各种气象条件(如h7-pres, h1-slp)为决定性因素方面达成共识。TabNet的实例级归因能够诊断特定事件。例如,对于SAIFI贡献最高的城市,主要贡献者是气象因素,而对于最高影响的馈线,结构属性(如电路长度LENGTH、导体规格CALIBRECONDUCTOR)占主要重要性。将TabNet的注意力归因与SHAP值进行对比验证,表明两者在识别核心结构驱动因素方面一致,但TabNet的稀疏注意力机制对动态气象波动表现出更敏锐的敏感性。
在代理RAG系统性能方面,比较评估显示,像Llama 3.2:1B和gpt-3.5-turbo这样的模型在语义质量和计算效率之间取得了最佳平衡。对非结构化数据领域的评估显示,GPT-4o是最可靠的基准,实现了最高的中位数F1分数(0.7571),反映了其在保留规范内容(召回率0.7429)的同时有效减少虚构不存在的法规(精确度0.7723)的平衡能力。端到端工作流通过一个实际用例展示,系统生成的具体诊断建议将预测见解与RETIE、IEC 62271-1、IEC 60529等法规标准联系起来。可解释的推理图提供了透明、可审计的追踪,记录了从优先资产及其关键变量到检索到的监管条款和最终建议的每个诊断步骤。
局限性与未来展望
CRITAIR框架的性能根本上取决于输入数据的质量和完整性。缺失或不精确的记录可能引入偏差。预测模型在所有评估设置下采用单一共享超参数配置,这限制了针对特定电路拓扑、气候区域或运营周期的领域特定优化。该系统的评估是在单个配电网络的运营环境和数据上进行的,其在不同拓扑、电压等级、资产密度和气候特征的网络中的普适性尚未得到测试。
未来工作将侧重于扩展框架以包括弹性分析,整合与高影响低概率事件相关的变量。将评估框架在多公用事业数据集上的适用性,以评估模型的可转移性。计划通过整合运营支出(OPEX)和资本支出(CAPEX)等经济变量来丰富分析框架,使CRITAIR能够评估技术行动的经济可行性。还将探索集成更先进的多代理架构以协作解决更复杂的查询,并研究持续学习机制的实现,使系统能够动态适应网络变化和监管更新。
结论
CRITAIR框架通过结合TabNet预测模块、代理RAG层和可解释推理图,为受监管电力公用事业的数字化转型提供了一个预测准确、解释性强且法规意识强的端到端解决方案。它有效地弥合了预测分析与透明监管治理之间的差距,代表了可靠性管理决策支持的重要工具。