美国东北部配电网空间拓扑数据集:融合复杂网络理论与地理信息科学的基础设施评估框架

《Scientific Data》:Harmonized geospatial data to evaluate the Electric Distribution Networks in the US Northeast

【字体: 时间:2025年12月21日 来源:Scientific Data 6.9

编辑推荐:

  为解决美国东北部配电网数据分散、缺乏统一标准的问题,研究人员开展了“美国东北部配电网空间拓扑数据集”的研究。该研究通过整合多源公用事业公司的Hosting Capacity Maps,构建了一个包含3,884,698条线路段、覆盖72.46%人口和84.96%地理区域的高分辨率数据集。该数据集不仅包含HostCap_MW、Voltage_kV等关键工程参数,还通过复杂网络理论计算了Betweenness Centrality、Fractality等拓扑指标,为评估电网韧性、能源公平性和分布式能源选址提供了开放、可复现的分析基础。

  
在能源转型的浪潮中,电力配电网(Electric Distribution Networks)作为连接发电端与千家万户的“最后一公里”,其重要性日益凸显。然而,与高压输电网络相比,中压配电网的数据往往分散在各大公用事业公司手中,缺乏统一的标准和开放获取的渠道。这种“数据孤岛”现象严重阻碍了研究人员和政策制定者对电网韧性、能源公平性以及分布式能源(Distributed Energy Resources, DER)接入潜力的系统性评估。尤其是在美国东北部,这片区域不仅拥有密集的城市群和广阔的乡村地带,还面临着基础设施老化、气候多变以及日益增长的电气化需求等多重挑战。因此,构建一个开放、统一、高分辨率的配电网空间数据集,已成为推动能源系统科学决策和实现公平能源转型的迫切需求。
为了填补这一关键空白,来自TBS商学院、拉蒙·柳利大学和哈佛大学的Bernat Salbanya、Jordi Nin和Ramon Gras Aloma团队,在《Scientific Data》上发表了题为“Harmonized geospatial data to evaluate the Electric Distribution Networks in the US Northeast”的研究论文。该研究通过整合多源公用事业公司的Hosting Capacity Maps(承载能力地图),构建了一个覆盖美国东北部七州(康涅狄格州、缅因州、马萨诸塞州、新罕布什尔州、纽约州、罗德岛州和佛蒙特州)的配电网空间拓扑数据集。该数据集不仅包含了线路的几何形态、承载能力(HostCap_MW)、运行电压(Voltage_kV)等关键工程参数,还通过复杂网络理论(Complex Network Theory)计算了节点度(Degree)、介数中心性(Betweenness Centrality)、分形维数(Fractality)等一系列拓扑指标,为评估电网韧性、能源公平性和分布式能源选址提供了开放、可复现的分析基础。
关键技术方法
研究人员开发了一套可复现的数据处理流程,主要包含以下关键步骤:
  1. 1.
    数据获取与清洗:从各公用事业公司公开的ArcGIS REST端点下载Hosting Capacity Maps数据,利用Python脚本进行数据清洗,包括统一字段命名、处理缺失值、剔除异常值以及几何校正。
  2. 2.
    工程参数估算:对于缺失的电压或电流数据,研究团队基于电力工程公式进行了估算。例如,利用公式P = √3 × V × I × PF(其中PF为功率因数,假设为0.95),在已知功率(P)和电流(I)的情况下估算电压(V),反之亦然。
  3. 3.
    网络拓扑建模:将清洗后的线状数据(Polylines)转换为空间图(Spatial Graph),其中节点(Nodes)代表线路的端点、交叉点和变电站,边(Edges)代表线路段。利用NetworkX、Momepy等库计算了节点度、介数中心性、紧密度中心性(Closeness Centrality)、直度中心性(Straightness Centrality)、方向熵(Entropy of Edge Orientations)和分形维数(Fractal Dimension)等20余种拓扑指标。
  4. 4.
    空间关联与聚合:通过空间连接(Spatial Join)将线路数据与人口普查区(Census Tract)边界进行关联,为每条线路段赋予唯一的GEOID(地理标识符),从而实现了电网数据与社会经济数据的无缝对接。最终,拓扑指标被聚合到人口普查区层面,生成了可供宏观分析的数据集。
研究结果
1. 数据集的规模与覆盖范围
该研究最终构建的配电网数据集共包含3,884,698条线路段,覆盖了美国东北部72.46%的人口和84.96%的地理区域。数据覆盖范围在州际层面存在显著差异,例如,罗德岛州的人口覆盖率高达99.91%,而纽约州的人口覆盖率仅为58.37%,这反映了不同地区公用事业公司数据开放程度的差异。
2. 关键工程参数的分布特征
研究团队对数据集中的关键工程参数进行了统计分析,揭示了不同公用事业公司之间的异质性。在承载能力(HostCap_MW)方面,城市和郊区公用事业公司(如ConEdison和Eversource)的分布呈现出右偏特征,即存在大量承载能力较高的线路段;而农村地区的公用事业公司(如Green Mountain Power)则呈现出更集中、容量更低的分布。在运行电压(Voltage_kV)方面,数据清晰地显示出4.16 kV、12.47 kV和13.8 kV等北美标准馈线设计电压的峰值,验证了数据的工程一致性。
3. 拓扑指标的统计分布
为了验证拓扑指标的有效性,研究团队对计算出的20余种全局拓扑变量进行了拟合优度分析(Goodness-of-Fit Analysis)。结果显示,大多数拓扑变量(如平均节点度、平均节点强度、密度等)的最佳拟合分布为对数正态分布(Log-Normal)或帕累托分布(Pareto),这符合复杂网络系统常见的统计规律,进一步证实了数据集的结构合理性。
结论与讨论
本研究成功构建并发布了一个开放、统一、高分辨率的美国东北部配电网空间拓扑数据集。该数据集不仅提供了线路的几何形态和关键工程参数,更重要的是,它通过复杂网络理论将电网抽象为图结构,并计算了丰富的拓扑指标,从而为电网研究提供了多维度的评估框架。
该数据集的重要意义在于:
  1. 1.
    填补数据空白:解决了美国东北部多州、多公用事业公司配电网数据缺乏统一标准的问题,为跨区域、跨公司的比较研究提供了基础。
  2. 2.
    支持多学科交叉研究:通过将电网数据与人口普查区(Census Tract)进行空间关联,该数据集为能源公平性研究、城市形态与基础设施关系研究等提供了可能。
  3. 3.
    赋能电网韧性评估:通过介数中心性(Betweenness Centrality)等指标,可以识别电网中的关键瓶颈线路;通过分形维数(Fractal Dimension)和方向熵(Entropy)等指标,可以量化电网的形态复杂性和冗余度,为电网升级改造和灾害恢复规划提供科学依据。
  4. 4.
    促进分布式能源发展:数据集中的承载能力(HostCap_MW)信息可直接用于分布式能源(如屋顶光伏、电动汽车充电桩)的选址和容量评估,支持能源系统的低碳转型。
总而言之,这项研究不仅提供了一个宝贵的数据资源,更展示了一种将复杂网络理论与地理信息系统相结合的分析范式,为未来电网的智能化、公平化和可持续化发展奠定了坚实的数据基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号