利用机器学习进行空间诊断和基于代理的需求建模，以评估电动汽车充电基础设施的需求

《Energy Conversion and Management-X》：Spatial diagnostics and proxy-based demand modeling for EV charging infrastructure using machine learning

【字体：大中小】 时间：2026年05月18日 来源：Energy Conversion and Management-X 7.6

编辑推荐：

　　M. Saber Eltohamy | Ali. M. El-Rifaie | Ahmed A.F. Youssef | Oussama Accouche | M. Hassan Tawfiq | S. Wahsh | Hossam Youssef | Amir Raouf | Junaid Ali Khan | M.M.R. Ahmed
电力电子与能量转换系，电子研究所，开罗12622，埃及

**摘要**
当前的城市环境面临着发展公平有效的电动汽车（EV）充电设施的日益增加的压力，这是由于人口密度和资源分布不均所致。本研究将基于集成机器学习算法（包括随机森林回归（RFR）和极端梯度提升（XGBoost）提供一个地理信息驱动的预测模型，以预测开罗各区域的电动汽车充电需求。该模型结合了本文提出的新指标（如充电可及性得分（CAS）、站点服务半径（SSR）和连接器多样性指数（CDI）以及更传统的变量（如人口密度、站点密度和功率容量）。最初的随机森林模型在解释能力上存在局限（R2 = 0.30）。改进后的XGBoost模型显著提升了预测性能，R2值达到0.76，均方根误差（RMSE）从113,767降至42,353，平均绝对误差（MAE）从85,589降至28,159。空间诊断显示，某些区域的基础设施存在显著差异，每个充电端口服务的用户数量超过18万人，这些区域是亟需关注的焦点。这些指标增强了模型的地理可解释性和预测能力。与传统更静态的规划方法相比，所提出的方法考虑了需求的可变性，并识别出服务不足的区域，这为在数据受限的城市环境中以更加公平和可持续的方式发展电动汽车基础设施提供了可扩展且数据密集型的工具。

**引言**
过去几年，全球能源行业的二氧化碳（CO?）排放量持续增加，国际能源署（IEA）估计到2025年能源行业将排放374亿吨二氧化碳。这种积极趋势意味着化石燃料的使用仍在继续，因此迫切需要大规模实施能源转型。除非加快脱碳进程，否则在未来几十年内排放量将超过400亿吨[1]。各国政府通过制定严格的气候政策来应对这一增长趋势，以减少气候变化的负面影响。交通运输是一个需要电气化的关键领域[2][3]，这将加速从化石能源向可再生能源和清洁能源的过渡。到2050年，电动汽车将占全球乘用车队的约31%[4]，这为减少碳排放和实现可持续发展目标提供了重要机会[5]。交通运输行业对空气污染的贡献巨大，其他来源还包括能源生产、家庭和商业排放以及工业[6]。这对人类健康和环境完整性有着重大影响。在环境保护方面，交通运输是一个特别重要的领域，因为汽车和卡车是全球温室气体排放的主要来源之一[7]。试图实现这一转型的城市面临着越来越大的挑战，城市规划者需要为所有人创造平等且便捷的电动汽车充电基础设施。传统的规划方法通常基于固定的人口统计数据或车辆拥有量，无法充分反映当代城市在空间结构和基础设施方面的实际情况。预测电动汽车充电的未来需求在技术和法规方面都至关重要。这项工作对于创建数据驱动的、空间明确的模型至关重要，这些模型可用于资源有限且快速城市化的城市（如开罗）的基础设施设计[8]。在这种情况下，预测电动汽车充电水平至关重要，它有助于能源规划者和基础设施运营商了解不同区域的负荷和需求差异，从而实现基础设施的合理分配和系统的稳定性。随着交通逐渐电动化，此类预测变得越来越重要[9]。图1展示了系统化且有条理的数据准备方法，这对于提高电动汽车充电需求预测的准确性至关重要。该方法从处理后的时间序列数据开始，这些数据通常包含充电站使用的能量信息（以千瓦时为单位）。为确保数据质量，数据需经过一系列处理，包括剔除异常值、填补缺失数据和对齐数据。根据预测精度需求，数据进一步按预定的时间间隔（如分钟、小时、天或月）进行划分。充电需求根据类型进行分类，区分公共充电和私人充电时段，以保持上下文信息并详细建模行为。机器学习（ML）模型采用滑动窗口方法进行训练，以学习随时间的变化。固定长度的窗口在时间序列上系统地扫描，形成重叠的数据块。每个样本通常由两部分组成：历史输入阶段（D12D4）和预测阶段（D5）。在高级架构（如时间卷积网络、门控循环单元（GRUs）和长短期记忆（LSTM）网络）中，这种方法能够很好地捕捉短期变化和长期趋势。生成样本后，将它们分为训练集和验证集，有助于模型开发和超参数优化。然后使用一组测试来评估模型的泛化能力。训练好的模型用于生成预测需求估计，这些估计结果可应用于下游应用。这一过程保证了时间一致性、统计可靠性和可扩展性，为电动汽车市场的先进分析奠定了基础。这种模块化设计使框架更具灵活性，适用于各种地理区域、数据粒度级别和模型类型，因此非常适用于复制。电动汽车充电系统（EVCS）离不开充电连接器，它们提供了安全的能量传输接口[11]。这些连接器根据世界上最常见的充电方式，满足不同的电压、电流和功率容量需求。目前，全球共有13种主要的组合充电系统（CCS），包括直流和交流快速充电应用[12]。这些连接器在电压范围、电流等级和功率传输能力方面存在差异[13]，这也影响了充电速率。最著名的充电标准包括日本的CHAdeMO、欧洲/北美的CCS、中国的GB/T和美国的Tesla[14]。表1列出了目前全球可用的充电连接器的所有技术规格[15]。

**本文结构**
第2节回顾了与数据驱动的电动汽车充电需求预测相关的现有研究。第3节介绍了建议的方法论、数据处理、空间特征生成以及RFR和XGBoost模型的实现。第4节解释了研究结果，并重点评估了模型的有效性及电动汽车充电基础设施的地理差异。最后，第5节总结了主要发现和政策建议，对可持续城市能源规划具有指导意义。

**下载：**
下载高分辨率图片（100KB）
下载全尺寸图片

**图1. 电动汽车需求预测的时间序列数据准备系统流程** [16]
**表1. 电动汽车充电连接器类型及其标准**
| 类型 | 连接器类型 | 电压范围 | 电流容量 | 功率等级 | 充电类型 | 备注 |
| --- | --- | --- | --- | --- | --- | --- |
| Type 1-AC (SAE J1772) | 250 V (AC) | 32 A | 6.6 kW | AC – 单相 | 美国和日本早期使用 | [19] |
| CCS-Type 1 (AC) | 120/240 V (AC) | 最大80 A | 19.2 kW | AC – 单相 | 从Type 1发展而来 | [20], [21] |
| CCS-Type 2 (AC) | 480 V (AC) | 63 A（每相） | 44 kW | AC – 单相/三相 | 欧洲标准 | [22], [23] |
| TESLA-AC | 240 V (AC) | 63 A | 22–43 kW | AC – 单相/三相 | 特斯拉专有 | [17] |
| Type 3-AC | 240 V (AC) | 32 A | 22 kW | AC – 单相/三相 | 有限使用 | [24], [25] |
| GB/T-AC | 380–480 V (AC) | 32 A | 22 kW | AC – 单相/三相 | 中国标准 (AC) | [20], [21] |
| CCS-Type 1 (DC) | 50–1000 V (DC) | 80 A | 80 kW | DC快速充电 | 美国使用 | [20], [21] |
| CCS-Type 2 (DC) | 50–1000 V (DC) | 最大400 A | 400 kW | DC快速充电 | 欧洲广泛采用 | [26], [27] |
| CHAdeMO-DC | 最大1000 V (DC) | 400 A | 400 kW | DC快速充电 | 日本起源，全球采用 | [22], [23] |
| TESLA-DC | 最大410 V (DC) | 800 A | 250 kW (315 V) | DC快速充电 | 特斯拉专有 | [24], [25] |
| GB/T-DC | 最大950 V (DC) | 250 A | 237.5 kW | DC快速充电 | 中国标准 (DC) | [28], [29], [30] |
| Bharat-AC (AC001) | 230 V (三相) | ?10 kW (3 × 3.3 kW) | AC | 低功率 | 区域标准 | [31], [32] |
| Bharat-DC (DC001) | 48–120 V (DC) | 最大200 A | 15 kW | DC | 低功率 | 区域标准 |在整合了社会空间指标和代理需求度量方法的概念后，这些方法可以在数据受限的环境中轻松使用，当前研究将电动汽车（EV）需求建模重新概念化为一个空间规划问题，而不仅仅是一个操作性问题。因此，当前研究提供了一个基础层，可以作为操作优化研究的起点。这可以通过缩小现有基础设施选址模型与能源需求模型之间的差距来实现。

除了基于优化的系统外，机器学习（ML）与空间分析的结合已成为一种强大的系统，用于预测电动汽车充电需求并决定基础设施的位置。ML方法被广泛用于预测不同地理区域的电动汽车充电需求。一项重要的研究提出了一种混合深度学习模型，该模型结合了时空需求和可再生能源数据，以改进充电基础设施的规划[42]。作者们证明，利用LSTM对城市中的充电热点进行地理信息系统（GIS）分析比单独分析这些问题更为有效[43][44]。最近的一项改进是将强化学习应用于电动汽车充电站（EVCS）的布局，以公平性为优先目标。该程序考虑了当代城市使用情况并估计了人口趋势，这有助于城市扩张的战略规划[45]。此外，还应用了一种两阶段时空模型，该模型结合了动态需求预测，使得在城市环境中更准确地安装基础设施成为可能[46]。

通过实证案例研究，对人工智能驱动和数据导向的解决方案在真实城市充电环境中的实际效果进行了验证。基于AI的模型已被证明对电动汽车充电基础设施具有实际优势，正如一项实证研究所展示的那样。在印度进行的一项研究中，使用了优雅的图卷积网络（GCN）和GRUs来预测高峰时段电动汽车的充电需求。研究结果表明，与传统自回归积分移动平均（ARIMA）方法相比，特别是在城市地区快速增长的情况下，这种方法有显著改进[47]。在韩国进行的另一项研究中，使用了多智能体深度强化学习（MADRL）架构，对30个城市充电站进行了纵向研究。灵活定价策略有望通过匹配供需来降低碳排放[48][49]。此外，还展示了将联邦学习应用于其他城市的情况，这有助于估计热点使用情况，同时不侵犯个人隐私。该研究考虑了共同的基础设施，并表明当使用实时电池电量（SoC）数据时，部署决策得到了显著改善[50]。

除了操作优化和实证案例研究之外，专门针对空间需求映射的预测框架在文献中越来越受欢迎。最近的一项研究使用了随机森林算法的ML方法来确定电动汽车充电基础设施的可访问性并最大化其位置。这种方法允许模型利用实际驾驶轨迹数据来确定地理分布不佳的区域，并提出最具可访问性和最少拥堵的地方。该方法还强调了在结合人口统计指标和交通流的情况下对需求进行建模的重要性。此外，还使用基于ML的系统来检查通往电动汽车充电站的道路可访问性。通过实际驾驶轨迹数据，研究人员能够识别基础设施分布中的空间不平等，并提出优化方案，以解决服务不足的社区问题[51]。在另一项研究中，深度强化学习与随机规划模型相结合，以应对需求和站点可用性的不确定性。这种方法在共享车辆的情况下特别有用，因为存在变异性[52]。

尽管取得了这些进展，但这些方法仍有一些缺点。许多当前的研究涉及模拟或人工数据，这些数据集并非基于真实的充电需求操作数据，而是生成的充电需求概况。其次，社会空间指标（如收入水平、城市密度和公共交通的可访问性）通常没有纳入建模框架中。最后，发展中国家的区域案例研究很少，特别是在北非和中东地区。这强调了需要适应特定环境的灵活结构，正如本文所讨论的那样。本文的主要发现如下：
1. 使用RFR和极端梯度提升（XGBoost）开发了一个具有空间意识的电动汽车充电需求预测模型。
2. 整合了新的工程化城市指标：充电可访问性得分（CAS）、站点服务半径（SSR）和连接器多样性指数（CDI），以提高空间可解释性。
3. 在数据受限的城市环境中应用该模型，以展示其在低数据环境中的可扩展性和适应性。
4. 包含关注公平性的指标，以识别服务不足的区域并支持社会包容性的基础设施规划。
5. 执行了比较评估，揭示了传统规划工具的局限性，并突出了基于集成模型的预测模型所提供的附加价值。

与其他通常关注描述性地理分析或依赖电动汽车使用实时数据的研究相比，所提出的模型是一个通用、可解释且主动的框架，应在新兴城市的初步实施中使用。表2提供了将本文与其他类似研究区分开来的主要特征的比较分析。

表2. 电动汽车充电需求建模方法的比较分析。

| 研究 | 空间分析 | ML | 社会空间数据 | EV使用数据 | 公平性考虑 | GIS工具 | 在发展中国家的适用性 |
| --- | --- | --- | --- | --- | --- | --- |
| [53] | ? | ? (随机森林, XGBoost) | ? | ? | ? | ? |
| [54] | ? | ? (模拟) | ? | ? | ? | ? |
| [55] | ? | ? (XGBoost, 人工神经网络) | ? | ? | ? | ? |
| [56] | ? | ? | ? | ? | ? | ? |
| [57] | ? | ? | ? | ? | ? | ? |
| [58] | ? | ? (优化) | ? | ? | ? | ? |
| [59] | ? | ? | ? | ? | ? | ? |
| [60] | ? | ? | ? | ? | ? | ? |

最近，电动车辆充电基础设施规划的发展特点是优化方法、空间分析和预测建模的日益使用，这些方法利用数据来应对电动城市交通系统的复杂性。文献可以分为三个主要的研究方向：
1. 基于优化的规划模型。
2. 基于GIS的空间可访问性分析。
3. 基于ML的预测方法。
优化研究倾向于集中于混合整数规划和多目标公式，以确定充电站的最佳位置和规模，基于交通网络和电网约束[54]。这些方法具有很好的理论严谨性和系统协调性，但通常需要高分辨率的出行行为数据和详细的电网参数，而这些在快速城市化和数据有限的城市中往往不可用。

在使用GIS的研究中，强调了电动汽车充电实施中的空间公平性和可访问性分析[59][60]。这些研究有助于检测人口统计方面的地理不平等和基础设施分布的差异。然而，大多数基于GIS的概念更具描述性，没有预测能力，这限制了它们在主动基础设施开发和长期规划方面的效率。最近，像随机森林和梯度提升这样的集成ML模型已被证明具有捕捉非线性电动汽车需求动态的高能力[58]。这些预测缩放方法通常基于真实的充电交易数据或高频率的运营数据，使它们在预测方面更加准确且更容易扩展。因此，它们仍然只能在实时充电消费数据不足或没有实时数据的新大城市中有限地使用。尽管取得了这些改进，但当前的研究仍存在三个差距：
- 空间诊断和预测建模之间的整合有限，其中可访问性分析和需求预测经常被视为独立的分析过程，而不是集成基础设施评估框架的组成部分。
- 依赖于数据丰富的环境，许多基于ML的预测模型是在消费数据集丰富的背景下开发的，这限制了它们向开罗等发展中的大都市地区的转移性。
- 基于代理的基础设施压力指标的正式化不足，现有研究很少引入明确量化区级充电能力相关的人口统计负担的工程化社会空间指标。

在本文中，我们将通过提供一种基于地理信息的、基于代理的预测策略来解决这些限制，该策略将SPDI、CAS和CDI等工程化指标纳入集成学习框架中。所提出的方法将通过结合理论ML建模和实际基础设施诊断，在数据受限的环境中改进现有技术，从而在快速城市化的地区开发出可扩展的、注重公平性的电动汽车基础设施。表3概述了文献中最常见的方法的系统比较，并总结了当前研究的贡献，包括关键方法论特征、数据要求、预测能力和在不同城市环境中的适用性。该表突出了现有优化、GIS和数据密集型ML模型的弱点，特别是在数据受限的情况下。所提出的基于代理的空间ML方法是解决这些限制的有效方法，因为它考虑了可扩展预测架构中的基础设施压力指标。

表3. 最先进的电动汽车充电基础设施规划方法的比较分析。

| 研究 | 核心方法 | 数据依赖性 | 预测能力 | 空间公平性分析 | 适用于数据稀缺城市的适用性 | 工程化压力指标 |
| --- | --- | --- | --- | --- | --- |
| [54] | 基于优化的规划 | 高分辨率电网和移动数据 | 有限 | 间接 | 低 | 否 |
| [59] | 基于GIS和ML的空间分析 | 中等到高 | 部分 | 强 | 中等 | 否 |
| [60] | 基于ML的预测回顾 | 高消费数据集 | 强 | 有限 | 低 | 否 |
| [58] | 集成ML需求建模 | 真实充电交易数据 | 强 | 有限 | 低 | 否 |

本研究介绍了一种空间明确的、基于代理的ML方法，用于信息受限的大城市的电动汽车充电基础设施的战略规划。与传统的操作调度模型不同，后者优化预定义网络结构内的能量流动，所提出的方法通过构建一个空间依赖的指数（SPDI）将电动汽车需求的变异性形式化为空间规划变量。该方法通过集成社会空间变量以及基础设施方面和工程化压力指标（RFR和XGBoost）在集成学习设计中，有助于系统地发现开罗的服务不足社区。通过跨模型比较、统计准确性分析（R2、RMSE、MAE）、残差分析和空间聚类，仔细分析了所提出框架的实证优势。报告讨论了所需的建议组件及其根据表4中的描述进行实证验证的方法。方法论创新、分析贡献和规划水平验证有明显区分。结果证实了XGBoost模型在表示城市内部需求变异性方面的有效性，并表明社会空间整合显著提高了数据受限环境中的诊断准确性。该框架开发了一个战略规划层，优化了操作优化模型，并将长期基础设施布局与短期能源系统管理联系起来。

表4. 提出的组件和实证验证结构。

| 组件 | 概念提案 | 实证验证 | 贡献维度 |
| --- | --- | --- | --- |
| 空间优先部署指数（SPDI） | 形式化区级基础设施压力 | 是 |
| 代理需求建模与残差中性分析 | 是 |
| 分析创新 | 是 |
| 社会空间特征整合 | 是 |
| 人口统计和基础设施决定因素在需求建模中的包含 | 是 |
| 特征重要性分析及性能提升 | 是 |
| 集成建模框架（RFR & XGBoost） | 是 |

本研究提出了一种空间明确的、基于代理的ML方法，用于信息受限的大城市的电动汽车充电基础设施的战略规划。与优化预定义网络结构内能量流动的经典操作调度模型不同，所提出的方法将电动汽车需求的变异性形式化为一个空间规划变量。该方法通过集成社会空间变量以及基础设施方面和工程化压力指标（RFR和XGBoost）在集成学习设计中，有助于系统地发现开罗的服务不足社区。通过交叉模型比较、统计准确性分析（R2、RMSE、MAE）、残差分析和空间聚类，仔细分析了所提出框架的实证优势。报告讨论了所需的建议组件及其根据表4中的描述进行的实证验证方法。方法论创新、分析贡献和规划水平验证有明显的区分。结果证实了XGBoost模型在表示城市内部需求变异性方面的有效性，并表明社会空间整合显著提高了数据受限环境中的诊断准确性。该框架开发了一个战略规划层，优化了操作优化模型，并将长期基础设施布局与短期能源系统管理联系起来。

本节提出了一个针对开罗城市环境的基于代理的需求建模框架，解决了当前空间和操作模型的限制。

**案例研究：开罗的城市和能源背景**
**数据描述和预处理**
本研究使用的数据集来自多个来源，包括有关开罗电动汽车充电基础设施和人口分布的地理和表格信息。关于EVCS的主要数据收集自PlugShare平台[61]。这些数据包括每个站点的以下信息：地理坐标（纬度和经度）、连接器类型（例如，Type 2、CCS2、Wall Euro）、充电端口数量、功率等级（kW）、可用性状态（例如，24/7访问）以及站点所有权类型（公共/私人）。中央公共动员和统计机构（CAPMAS）提供了2025年的估计人口数据[62]，后来与开罗省的官方数据进行了核对[63]。在GIS中，使用空间连接过程将充电站与其行政区域进行空间匹配。这使得可以将包括人口密度在内的社会人口统计信息添加到特征工程过程中。由于没有关于收入水平的数据，因此这些数据没有被纳入最终模型中。

数据预处理和空间特征工程框架
采用了一种预处理工作流程来保证数据的完整性、一致性以及适用于机器学习应用。第一阶段是数据净化，其中纠正了连接类型名称和功率等级的不一致性，根据特定领域的协议输入了缺失值，并移除了冗余或不完整的记录。分类变量（包括站点类型和可用性）使用独热编码进行编码，而连续变量（包括功率等级和人口密度）则使用Z分数标准化进行标准化。为了提高模型的可解释性，还包括了可用性指标的二进制编码。空间特征准备涉及将地理坐标转换为通用横轴墨卡托（UTM）36N区，以准确计算距离，最终生成了其他空间指标，如SSR、CDI和CAS。使用四分位数范围和Z分数技术来识别异常值和结果不合理的记录，包括连接数为0的站点[64]。对最终数据集进行分层抽样，将其分为训练集（80%）和验证集（20%），以保持开罗各区域站点属性的代表性。使用核密度估计（KDE）分析了电动汽车基础设施的空间分布（图2显示了结果）。高分辨率的可视化结果揭示了基础设施的聚集模式，并指出了服务覆盖不足的区域。这样的空间框架为进一步的建模和公平性分析提供了起点。

下载：下载高分辨率图像（80KB）
下载：下载全尺寸图像
图2. 使用UTM坐标（36N区）的开罗电动汽车充电站的空间密度。

下图（图3）显示，注册的电动汽车数量显著增加，2020年的注册数量为159辆，而2025年3月的注册数量为13,359辆。2021年7月21日至2025年11月底之间的注册数量没有官方记录。这一增长可以归因于多种因素：环境意识的提高、消费者选择范围的扩大、电动汽车的可访问性增强以及政府激励措施的引入。这一数字代表了埃及电动汽车注册的累积趋势，清楚地表明了市场的发展。尽管市场上的电动汽车数量持续增加，但采用这项技术仍面临许多挑战。用户在某些情况下使用电动汽车不如使用传统燃油汽车方便，主要是因为充电所需的时间较长以及社区内充电点的不足[65]。开罗的人口结构显示，城市行政单位内部存在较高程度的人口不平等。东部和南部地区人口最多，这些地区由大型住宅区组成，具有坚实的城市结构和较高的内部迁移率。东部地区包括El-Marg、Ain Shams和El-Mataria区，而南部地区包括Dar El-Salam、Helwan和El-Basateen区。相比之下，西部地区和新城区的人口密度较低，这可能是由于住宅容量较低或城市发展较晚所致。西部城市的例子有Bulaq和Rod El-Farag，新城区包括New Cairo、Badr City和El-Shorouk。图4中的人口统计数据显示了城市扩张、基础设施分布和迁移模式对开罗人口结构的影响[63]。

下载：下载高分辨率图像（129KB）
下载：下载全尺寸图像
图3. 埃及电动汽车充电站的累计注册数量（2020–2025年）[66]。

下载：下载高分辨率图像（57KB）
下载：下载全尺寸图像
图4. 开罗各区域的人口分布。

开罗地区的能源基础设施状况
电力系统的灵活性是指电力系统应对可再生能源发电突然变化和发电预测不可预测性的能力，这是确定当前电网是否能够满足新兴出行需求的关键。在人口密集的城市中，这一概念尤为重要，因为了解电力生成基础设施的空间布局对于评估电动汽车充电站实施的可行性和空间公平性至关重要。电动汽车充电站的选址受到电力生成基础设施分布的影响，包括其可行性和公平性。为了正确模拟人口密集地区的充电需求，了解这些基础设施非常重要，因为这些地区的电网稳定性和供应能力可能变化很大。该城市的能源供应网络主要由大规模蒸汽和联合循环发电厂组成，它们满足了大部分电力需求，从而提供了可靠性[67]。这些设施的组成和分布表明了主要的发电模式，主要基于高容量电站，如Shubra El-Kheima、Tebbin和North Giza，这三个电站的组成和分布在表5中进行了总结。将这一基础设施组件纳入预测模型，增强了模型解释电力接入和传输效率的地理位置差异的能力，从而更准确地反映了供应方面的限制。分析后，研究确认了电动汽车充电基础设施的公平分布、空间可访问性和发电能力之间存在高度相关性，因此建议在数据受限的城市环境中采取综合策略进行可持续出行规划。开罗电力网络的需求模式具有时间依赖性，这是确定电网容量以满足未来几年电动汽车充电需求时必须考虑的因素之一。表6给出了2019-2024年间每小时峰值负荷的标准化数据（单位：MW）。数据显示，这些数值逐渐增加，最大值从2019年的约29.5 MW增加到2024年的36.9 MW，五年间增加了近25%。日负荷曲线显示，用电高峰通常出现在晚上8点左右。此时家庭、企业和政府设施的用电量同时增加。2024年，最高的记录峰值负荷为36.9 MW，出现在晚上8点。此时，配电网络最为脆弱。然而，低负荷通常出现在凌晨4点到6点之间，数值约为28.29 MW[68]。实际供应限制和时间变化被纳入预测模型中，以提高电动汽车充电需求的预测可靠性。这一深入评估表明，基础设施的空间公平性与能源行为的动态之间存在相关性。这将有助于我们基于数据和电网意识开发开罗的可持续电动汽车充电网络。

表5. 开罗的发电站及其按技术类型划分的安装容量和有效容量
| 发电站 | 安装容量（MW） | 有效容量（MW） | 技术类型 |
| --- | --- | --- | --- |
| Shubra El-Kheima | 4 × 31.5 | 126.0 | 蒸汽 |
| Shubra El-Kheima | 1 × 35 | 35.0 | 蒸汽 |
| West Cairo Extension | 2 × 35 | 0 + 2 × 33.3 | 136.7 | 136.0 |
| West Cairo Ninth | 1 × 65 | 0 | 65.0 |
| South Cairo Central | 1 × 11 + 1 × 55 | ? | 蒸汽 |
| North Cairo Central | 4 × 50 + 4 × 20.5 | 40.2 | 40.0 |
| Tebbin | 2 × 35 | 70.0 | 70.0 |
| 6th of October | 1 × 15 | 150.0 | 150.0 |
| Gas | 6th of October Extension | 4 × 150 + 1 × 178 | 91.8 | 18.7 |
| Combined Cycle | North Giza Central | 2 × 250 + 3 × 50 | 625.0 | 625.0 |

表6. 开罗的每小时负荷数据（单位：MW，2019–2024年）
| 月份 | 2019 | 2020 | 2021 | 2022 | 2023 | 2024 |
| --- | --- | --- | --- | --- | --- |
| 1 | 129.5 | 29.3 | 29.8 | 30.8 | 31.8 |
| 2 | 229.0 | 29.0 | 29.5 | 30.5 | 31.6 |
| 3 | 34.4 | 28.7 | 28.7 | 29.2 | 31.4 |
| 4 | 332 | 28.4 | 28.9 | 30.0 | 31.2 |
| 5 | 242 | 28.4 | 28.9 | 30.8 | 32.9 |
| 6 | 28.2 | 28.1 | 29.8 | 31.0 | 33.1 |
| 7 | 28.8 | 28.7 | 29.2 | 30.3 | 33.2 |
| 8 | 28.1 | 28.6 | 29.8 | 31.0 | 33.8 |
| 9 | 28.3 | 28.2 | 28.7 | 29.6 | 31.0 |
| 10 | 28.8 | 28.7 | 29.2 | 30.3 | 33.4 |
| 11 | 242 | 28.4 | 28.4 | 28.9 | 30.0 |
| 12 | 28.2 | 28.1 | 29.8 | 31.0 | 33.4 |
| 13 | 245 | 28.2 | 28.1 | 28.6 | 29.8 |
| 14 | 28.1 | 28.0 | 29.6 | 30.8 |
| 15 | 28.3 | 28.8 | 29.2 | 33.2 |
| 16 | 242 | 28.4 | 28.4 | 28.9 | 30.0 |
| 17 | 28.2 | 28.1 | 29.8 | 31.0 |
| 18 | 28.8 | 28.7 | 29.2 | 33.2 |
| 19 | 28.3 | 28.8 | 29.6 | 31.0 |
| 20 | 28.2 | 28.7 | 29.2 | 33.4 |
| 21 | 242 | 28.4 | 28.4 | 28.9 |
| 22 | 28.2 | 28.1 | 29.8 | 31.0 |
| 23 | 245 | 28.2 | 28.1 | 29.6 |
| 24 | 28.8 | 28.7 | 29.2 | 33.2 |
| 25 | 28.3 | 28.8 | 29.6 | 31.0 |
| 26 | 28.1 | 28.0 | 29.8 | 33.1 |
| 27 | 28.2 | 28.7 | 29.2 | 33.4 |
| 28 | 28.1 | 28.6 | 29.8 | 31.0 |
| 29 | 28.3 | 28.8 | 29.6 | 33.2 |
| 30 | 28.2 | 28.7 | 29.2 | 33.4 |
| 31 | 242 | 28.4 | 28.4 | 28.9 |
| 32 | 28.2 | 28.1 | 29.8 | 33.2 |
| 33 | 245 | 28.2 | 28.4 | 28.9 |
| 34 | 28.1 | 28.6 | 29.8 |
| 35 | 28.3 | 28.8 | 29.6 |
| 36 | 28.2 | 28.1 | 29.8 |
| 37 | 28.3 | 28.7 | 29.2 |
| 38 | 28.2 | 28.7 | 29.6 |
| 39 | 28.1 | 28.6 | 29.8 |
| 40 | 28.3 | 28.8 | 29.6 |
| 41 | 28.2 | 28.7 | 29.2 |
| 42 | 28.1 | 28.6 | 29.8 |
| 43 | 28.2 | 28.7 | 29.6 |
| 44 | 28.1 | 28.6 | 29.8 |
| 45 | 28.2 | 28.7 | 29.6 |
| 46 | 28.1 | 28.6 | 29.8 |
| 47 | 28.3 | 28.8 | 29.6 |
| 48 | 28.2 | 28.7 | 29.2 |
| 49 | 28.1 | 28.6 | 29.8 |
| 50 | 28.3 | 28.7 | 29.2 |

开罗地区的电动汽车充电成本
埃及的电动汽车充电成本在空间和技术上存在很大差异，这取决于充电基础设施的性质和电力来源。根据第101/2025号部长令，公共充电的费用取决于连接电压和充电技术。表7显示，中等电压的交流慢速充电器（通常功率为223 kW）的收费为2.81 EGP/kWh，而直流快速充电器（大约50 kW）的收费为5.34 EGP/kWh。在低电压下，交流和直流充电的费用分别增加到EGP 3.39和EGP 6.55/kWh。另一方面，家庭充电采用分层定价系统，符合国家住宅电价标准。表8显示，埃及的住宅电价在0.38至1.18 EGP/kWh之间，具体取决于使用类别。该计划强调了家庭充电的财务优势，特别是对于低功率用户来说，使其更具成本效益和可持续性。电价的变化表明了激励计划和综合电价优化的必要性。这些措施对于维持基础设施的可持续性、确保消费者负担得起以及埃及不断发展的电动汽车行业的电网流量至关重要[69]。

表7. 埃及的公共电动汽车充电费率
| 充电功率（kW） | 充电类型 | 每千瓦时费用（EGP） | 充电地点 | 电网电压 |
| --- | --- | --- | --- | --- |
| 22 AC（慢速） | 2.81 | 公共充电站 | 中等电压 |
| 23 AC（慢速） | 3.39 | 公共充电站 | 低电压 |
| 50 DC（快速） | 5.34 | 公共充电站 | 中等电压 |
| 65 DC（快速） | 5.34 | 公共充电站 | 低电压 |

表8. 埃及家庭电动汽车交流充电费用（按消费等级划分）
| 消费等级（kWh/月） | 每千瓦时费用（EGP） |
| --- | --- | --- |
| 0–50 | 0.68 |
| 51–100 | 0.78 |
| 100–200 | 0.95 |
| 201–350 | 1.55 |
| 351–650 | 1.95 |
| 651–1000 | 2.10 |
| 超过1000 | 2.23（固定费率） |

埃及每月电动汽车注册情况概述（2023年至2025年）
在过去两年中，埃及电动汽车市场的采用率显著增长，这可以归因于消费者意识的提高、有利的政策计划和市场多样化。现有的汽车制造商，包括大众、梅赛德斯-奔驰和宝马，一直在市场上保持稳定的存在，注册数量根据供应链状况和产品可用性而波动。然而，由于新进入者的加入，如Zeekr、Xpeng、Rox和Avatr，以及老牌制造商如比亚迪和特斯拉，竞争环境也显著增强[71]。这种多样化不仅表明了市场偏好的变化，还表明埃及正在成为更广泛的电动汽车供应链的一部分，尤其是东亚地区的供应链。消费者对高端车型兴趣的增加，同时经济型车型仍然受欢迎，这反映了豪华品牌和大众品牌在不同市场细分中的竞争情况。观察期间，私人注册的电动汽车数量显著增加，表明这一趋势是积极的。这一指数级增长通过2023年和2025年第三季度之间的月度注册数据进行对比可以看出[72]。这些趋势得到了表9和表10中提供的数据集的支持，提供了重要的实证证据。

表9. 2023年9月至2024年12月埃及各品牌的月度电动汽车注册数量[71]，[72]
| 品牌 | 2023 | 2024 |
| --- | --- |
| Volkswagen | 421 | 141 |
| Mercedes | 142 | 136 |
| BMW | 142 | 133 |
| Nissan | 142 | 139 |
| BYD | 107 | 109 |
| Tesla | 102 | 106 |
| MG | 102 | 109 |
| Volvo | 102 | 102 |
| Kia | 102 | 102 |
| Porsche | 102 | 102 |
| Rolls-Royce | 102 | 102 |
| Chevrolet | 102 | 102 |
| Other Brands | 102 | 102 |

表10. 2025年1月至12月埃及各品牌的月度电动汽车注册数量[66]
| 品牌 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 |
| --- | --- | --- | --- | --- | --- | --- | --- | --- | --- |
| Volkswagen | 100 | 77 | 85 | 95 | 122 | 70 | 81 | 68 | 196 | 262 | 221 | 141 |
| Mercedes | 142 | 133 | 355 | 438 | 505 | 87 | 57 | 111 | 72 | 172 | 105 | 102 | 89 |
| BMW | 102 | 312 | 323 | 139 | 526 | 370 | 80 | 90 | 81 | 68 | 50 | 57 |
| Tesla | 101 | 09 | 22 | 22 | 22 | 28 | 151 | 31 | 151 | 41 | ? |
| BYD | 107 | ? | 36 | 40 | 79 | 49 | 46 | 63 | 51 | 110 | 99 | 61 |
| Nissan | 102 | ? | 36 | 40 | 79 | 49 | 46 | 35 | 110 | 99 | 61 |
| Volvo | 102 | ? | ? | ? | ? | ? | ? | ? |
| Kia | 102 | ? | ? | ? | ? | ? | ? |
| Porsche | 102 | ? | ? | ? | ? | ? | ? |
| Chevrolet | 102 | ? | ? | ? | ? | ? | ? |
| Rolls-Royce | 102 | ? | ? | ? | ? | ? | ? |
| Fiat | 102 | ? | ? | ? | ? | ? | ? |
| Daynal | 102 | ? | ? | ? | ? | ? |
| Xiaomi | 102 | ? | ? | ? | ? | ? |
| Changan | 102 | ? | ? | ? | ? | ? |
| Dongfeng | 102 | ? | ? | ? | ? | ? |
| IM Motors | 102 | ? | ? | ? | ? | ? |
| Smart | 102 | ? | ? | ? | ? | ? |
| Other Brands | 102 | ? | ? | ? | ? | ? |

总体而言，2023年至2025年埃及每月电动汽车注册总数为18,448辆。这种形式化提供了一个系统化的预测系统模型，在该模型中，输入特征与模型的输出有明确的关联。为了预测开罗城市环境中各区域电动汽车（EV）充电的需求，本研究采用了一种多阶段、数据驱动的方法论模型。该技术应用了与各个充电站相关的社会空间特征、人口特征和技术特征，并构建了一个强大的预测模型，能够识别服务不足的区域并估算基础设施需求。首先进行的是信息的收集和整合，这包括空间和非空间数据集的清洗和整理。这些数据集包括人口估计、充电基础设施规格以及充电站的可用性，并将其统一为适合建模的格式。进一步的发展集中在特定领域的特征上，以提高模型的表现能力。为了获得衍生指标（如充电站多样性指数和可访问性评分），有必要记录不同地理位置上电动汽车用户需求的异质性。该框架的预测能力基于RFR（Random Forest Regression），选择它是因为其在高维数据的非线性建模方面具有专长，能够避免过拟合，并且具有非参数特性。构建的特征集随后被输入模型中，通过回归性能指标（包括R2、MAE和RMSE）进行评估。模型的最终输出被转换为空间需求表面，绘制在区域层面上，为政策制定者在基础设施的战术性分配提供了便利工具。图5展示了整个方法论工作流程的示意图，说明了数据准备、模型训练、评估和地理空间可视化的顺序流程。

特征工程对于提高模型性能至关重要，因为它将原始输入数据转换为反映城市电动汽车充电需求复杂性的信息性预测因子。在这项研究中，使用了基于地理、技术及人口变量的多种综合特征来缩小输入范围并增强模型的泛化能力。首先建立了CDI（Connector Diversity Index）指标，该指标衡量每个充电站提供的连接器类型的多样性，评估充电站支持不同电动汽车型号的能力。方程（2）表示了这种关系：
(2) CDIi = 站点i处独特连接器类型数量 / 站点i可能连接器类型总数
CDI的增加意味着对用户的互操作性和包容性的提高。其次，计算了每个行政区域的PSR（Plug Share Rate），以反映充电基础设施上的负载比例。该比率表示每个充电站服务的居民数量，如方程（3）所示：
(3) PSRi = PiSi
其中Pi是区域i的人口估计值，Si是该区域内的充电站数量。高PSR表明可能存在服务缺口或服务不足的区域。第三，设计了CAS（Charging Station Availability）指标，考虑了充电站的数量及其工作时间。在方程（4）中，24/7运营的充电站被赋予了更高的优先级，因为它们更易于访问且提供更多服务：
(4) CASi = 1.0（如果24/7可用）；0.5（如果工作时间有限）；0.0（如果不可用）
CASi是充电站可用性的评分，该评分基于工作时间。当充电站24/7可用时得分为1，表示完全可用；工作时间受限时得分为0.5，表示部分可用；当充电站不可用时得分为0。这种分类用于将充电站作为标准化输入纳入预测模型。此外，还使用了SSR（Service Coverage Ratio）来量化每个充电站覆盖的区域范围，该指标用于获取空间可访问性，其计算公式如下：
(5) SSRi = AiSi.π
其中Ai是区域i的土地面积，Si是该区域内的充电站数量。较低的SSR值意味着充电基础设施密度较高，用户的平均行驶距离较短。其他工程化特征还包括每个充电站的平均功率等级（千瓦）、区域内的充电站密度（每平方公里）、充电站类型（公共/私人）以及运营特性。

集成学习模型采用了这些工程化指标的组合结构化特征向量。这种方法确保了空间可访问性、人口压力和基础设施异质性被纳入模型中。这种严格的整合清晰地连接了特征构建与模型估计，从而解释了工程化指标与预测算法之间的相互作用。为了使建模框架在数学和方法论上透明，表11总结了所有纳入建模框架的工程化空间指标的数学定义、单位和数据来源。

本研究选择了两种基于集成学习的机器学习模型RFR和XGBoost来预测地理上多样化的都市区域的电动汽车充电需求。选择这些模型的原因是它们能够同时表示人口、基础设施和地理因素之间的非线性相互作用，并具有较高的预测稳健性。RFR方法通过自助采样生成多棵决策树，然后将这些输出结合起来得出一致的预测结果，从而减少过拟合的影响并提高模型的泛化能力[73]。这种技术在信息稀缺或不可用的城市中特别有用，因为这些城市中充电站密度、人口分布和可访问性之间的相互关系较为复杂[74]。XGBoost基于梯度提升的概念，通过减少前驱决策树的残差误差来提高预测准确性。此外，该方法通过正则化防止模型变得过于复杂。XGBoost在动态空间模式的建模方面效率最高，其在基础设施和能源需求预测方面的准确性处于领先水平[77]。RFR和XGBoost的概念框架和结构框架之间的区别如图6所示。RFR采用装袋方法，需要通过自助采样独立构建多棵决策树，然后将这些树的结果相加得到最终预测。而XGBoost采用顺序梯度提升策略，通过新树的构建来修正之前的决策树。需要指出的是，这种比较是结构和方法论上的。上图旨在解释学习方案和优化方法上的差异，但没有展示计算性能数据或基准测试结果。

本文使用基于决策树的强大集成学习框架RFR来预测开罗市各区域的电动汽车充电需求。选择RFR是因为它能够检测非线性相关性，处理分类和数值变量，并具有强大的泛化能力以及抗过拟合能力。此外，它高度可解释且对参数变化不敏感，这增加了其在以基础设施为中心的预测应用中的适用性。随机森林算法是一种集成算法，基于多个独立训练的决策树的预测；每个决策树都在训练数据的自助采样上进行训练。为了提高模型多样性并减少过拟合，在每个决策节点进行特征随机选择。不同树的预测平均值决定了每个输入x的最终预测结果，如方程（6）所示：
(6) y^x = 1/∑t=1T ht(x)
其中y^x表示预测的电动汽车充电需求，T表示决策树的总数，ht(x)表示第t棵树的预测结果。目标变量是通过适当的建模技术估计的，即每个区域的充电需求，作为人口压力（人与充电站的比例）、可访问性（可用性评分）和服务多样性（连接器种类）的函数。通过网格搜索和五折交叉验证，我们找到了超参数的最佳值，包括树的数量（n_estimators）、最大深度和每叶最小样本数。这有助于在模型复杂性和预测准确性之间找到良好的平衡。模型的定量性能通过三个标准回归指标（RMSE、MAE和R2）进行评估。RMSE计算实际值与预测值之间平方偏差的平均值的平方根，公式如下：
(7) RMSE = 1/√∑i=1n (yi - y^i)^2
其中n表示数据点的总数，yi表示第i个观测值的目标变量实际值，y^i表示模型预测的同一观测值的预测值，求和∑i=1n (yi - y^i)^2计算所有观测值的总平方误差。在这项研究中，开罗市各区域电动汽车充电需求预测的平均误差幅度以RMSE表示，由于平方操作，RMSE对较大偏差的惩罚较大，因此它是衡量模型在高需求变化区域性能的敏感指标。RMSE越小，预测框架的可靠性越高，因为模型预测的实际值与代理值越接近。MAE表示预测值与实际值之间绝对差异的平均幅度，强烈指示了预测的准确性，并且对异常值的依赖性较低，如方程（8）所示：
(8) MAE = 1/√∑i=1n (yi - y^i)
其中n表示观测值的总数，yi表示第i个区域的目标变量实际值，y^i表示模型预测的同一区域的电动汽车充电需求。求和项∑i=1n |yi - y^i|计算所有区域的总绝对偏差。正如本文所讨论的，MAE清楚地表明了开罗市各区域电动汽车充电需求预测的平均误差。MAE也非常适合评估在不同需求强度区域中模型的整体稳定性，因为它不像RMSE那样对较大偏差进行过度惩罚。当MAE较低时，表明使用预测值和代理值确定的实际值之间的对应关系更好，因此模型在异质城市景观中的性能更好。R2表示模型解释因变量变化的程度，值接近1表示模型解释了较大比例的变异，如方程（9）所示：
(9) R2 = 1 - ∑i=1n (yi - y^i)^2 / ∑i=1n (yi - yˉ)^2
其中yˉ是实际观测值的平均值。R2接近1的值表明模型解释了较高比例的变异，而接近0的值表明拟合效果较差。在本文中，R2量化了模型在开罗市各区域准确描述电动汽车充电需求空间变异的程度。如果R2接近1，表明模型有效地解释了受基础设施特征和人口压力影响的需求变化。相反，接近零的值意味着模型的解释能力有限，这表明需要补充特征或改进模型架构。由于开罗的EVCSs不提供关于其运营活动的实时数据，因此通过基于人口密度和站点容量的指标来评估模型的性能。在实际需求情况下，通过计算每个区域每个充电站的人数来作为代理指标。这是对在没有直接消费数据的情况下系统预期充电量的近似值。我们根据站点可访问性的容易程度制定了一个非常基本的调整比率，以得出预测需求。人们认为对所有人开放的公共充电站将更高效，并且压力会较小。它们的需求预计将达到实际需求估计的80%。相反，私人/混合充电站可能不容易获得，或者位置可能不理想，这可能会对每个端口造成额外的压力。因此，我们认为私人/混合充电站的需求将是实际需求预测的90%。基于此，我们开发了一个简单的预测场景，并测试了其准确性。图7以散点图的形式显示了每个区域的实际需求和预测需求之间的比较结果。图中的每个点代表一个区域。点越接近对角线y=x，该区域的预测就越准确。如图所示，许多点都接近这条线，因此估计方法与基于基础设施的需求模式非常吻合。为了进一步验证模型的平衡性，我们检查了残差，即实际需求与预测需求之间的差异（残差=实际需求-预测需求）。图8中的直方图显示了这些残差，上面叠加了一条密度曲线。平均值为零，没有长尾或正偏度。这意味着模型在不同区域的需求预测上不会总是过高或过低，这是模型结构中立性和公平性的一个很好的指标。

下载：下载高分辨率图像（184KB）
下载：下载全尺寸图像
图7. 按区域划分的实际需求与预测需求

下载：下载高分辨率图像（135KB）
下载：下载全尺寸图像
图8. 残差分布（实际需求-预测需求）

结果
为了对开罗的社会空间环境有一个基本的了解，将2025年的人口预测与充电系统的地理信息和区域大小结合起来。计算结果如表4所示，其中包含了人口密度（公式（10））、站点密度（公式（11）和SPDI（公式（12））。这些数据共同提供了基础设施充足性的整体视图。（10）Populodensedtnyi=PiSi（11）StationDsedtnyi=SiAi（12）SPDIi=PiNiPi，其中Pi是区域i的预测人口，Ai是土地面积（平方公里），Si是充电站/端口的数量，Ni是区域i中的总充电端口数量。结果显示开罗各区域之间存在很大差异。Nasr City的人口估计约为763,000人，每个端口的SPDI约为15,000人，这是一个良好的基础设施与人口比例。相比之下，Zeitoun的压力很大，因为一个充电端口要服务大约188,000名居民，导致每个端口的SPDI超过188,000人。像Al Zaher这样的较小区域人口密度很高（41,000/平方公里），但缺乏充电设施。表12详细比较了可以根据服务不足情况优先考虑的区域。CDI指出，大多数可用充电点的数量取决于一两种连接类型，尽管Nasr City显示出更高的多样性。

表12. 开罗EV基础设施规划的空间和人口指标
区域人口人口密度站点密度 SPDI CDI
Boulaq 52,003 928 6.25 0.357
Hadaieq Al Qobba 341,321 262 5.46 0.308
Al Waily 163,273 116 62.36 0.357
Al Zaher 82,000 410 0.00 0.58
Al Khalifa 113,632 162 33.14 0.429
Nasr City 763,278 305 3.11 0.20
414,966 0.5
Zeitoun 188,123 330 839.84 0.16
Misr Al Gadida 144,832 160 92.44 0.22
El Mokattam 242,009 672 2.47 0.139
Helwan 562,889 865 9.83 0.015
El Nozha 249,714 186 3.54 0.157
Al Maadi 95,675 478 3.75 0.67
Al Basateen 534,858 445 71.50 0.25
El-Salam 685,047 263 47.96 0.19
Katameya 76,523 478 2.69 0.18
Fifth Settlement-New Cairo 146,655 162 9.50 0.05

模型性能评估
通过确定各种解释变量，包括人口规模、人口密度、站点密度和CDI，使用RFR来确定开罗各区域的充电需求。由于没有充电站的实际消费数据，因此使用SPDI（人口与端口的比例）作为需求的代理数据，以提供基础设施压力的可行近似值。为了确定模型的有效性，将预测值与实际估计值进行了比较。图9还展示了每个区域实际需求与预测需求的散点图。可以观察到，大多数区域都聚集在45度线（y=x）附近，这意味着模型能够以很高的一致性再现需求模式。随后通过残差分析进行了评估，残差定义为实际需求与预测需求之间的差异（残差=实际需求-预测需求）。图10以直方图的形式显示了各区域的残差分布。残差的偏度不高，因为它们集中在零附近，这意味着模型不会总是过高或低估需求。这种公平的分配增强了方法的结构客观性。尽管由于样本量小和数据限制，性能的定量指标（如RMSE、MAE和R2）的预测能力不强，但视觉验证和稳定的分布模式表明，该模型在数据不足的情况下具有实用价值，是一个成本效益高且可扩展的诊断工具。这些发现与研究的主要目标一致，即为新的城市环境提供清晰灵活的基础设施发展模型。使用代理需求值SPDI来支持RFR。关键性能参数总结在表13中，而图9和图10分别表示实际需求与预测需求的散点图和残差分布。表14显示了解释变量对充电需求预测的影响。研究表明，人口规模（约38）和站点密度（约37）是解释需求变化的主要因素。社会空间特征也很重要，因为人口密度的影响相对较低，约为24。然而，CDI（=1）对需求代理的贡献不大，这表明人口密度和端口数量比连接类型的多样性起着更大的作用。在标准化连接和多样性之前，政策制定者应主要关注人口密集地区的充电能力。首先使用RFR算法是因为它具有很强的抗过拟合能力。然而，在预测性能方面并不令人满意。因此，有必要引入XGBoost算法以提高模型的准确性并检查算法的稳定性。XGBoost算法在所研究的城市环境中的表现支持了梯度提升算法的适用性。

下载：下载高分辨率图像（63KB）
下载：下载全尺寸图像
图9. 实际SPDI与预测SPDI：模型验证概述
下载：下载高分辨率图像（70KB）
下载：下载全尺寸图像
图10. SPDI模型的预测误差分布

表13. SPDI预测模型的性能指标
指标值
RMSE 113767.88
MAE 85589.16
R2 0.3

表14. 随机森林模型的特征重要性得分
特征重要性
人口 0.381
站点密度 0.3676
人口密度 0.2404
CDI 0.0109

为了解释预测性能的可靠性，需要考虑到SPDI是一个综合代理指标，而不是消费的最终指标。尽管SPDI技术上是人口与端口的比例，但预测模型的构建方式并不是为了再现这种封闭形式的公式。使用了几种地理和人口统计指标（如人口密度、站点密度、CAS、CDI和SSR）来训练集成模型，以便算法能够检测非线性空间关联和区域间的各种压力模式。此外，在训练过程中使用了五次交叉验证，以避免过拟合并测试模型的泛化能力。XGBoost内置了正则化方法，如L1和L2规范化、收缩和采样，这些方法减少了记住某些基本算术关系的机会。改进后的R2值表明更好地代表了地理异质性，而不仅仅是代理公式的简单复制。

模型增强和EV充电需求预测评估
XGBoost是一种高技术的机器学习算法，属于决策树集成方法。该模型以递归方式构建，使用梯度下降优化改进了先前模型的预测。XGBoost还具有高预测准确性、计算效率以及处理缺失数据和非线性关系的能力。本研究中使用的模型是XGBoost，它基于以下特征进行训练：
- 2025年的预测人口
- 每个区域的EV充电端口数量
- 站点类型：编码为数值变量
- SPDI：计算为每个端口的人口

这些变量使模型能够广泛了解地理基础设施和人口情况，从而与其他模型相比在性能上取得了显著提升。最初使用的RFR模型用于预测城市中的EV充电需求，但其决定系数非常低（R2=0.3），说明预测效果不佳。这是因为没有合适的数据特征，包括多重共线性，也没有进行特征工程。为了提高模型的韧性和可靠性，开发了一种包含三个关键阶段的独特建模方法：高级特征工程、算法优化和残差诊断。添加了一个重要的工程量，即每个区域的SPDI（人口与端口的比例），该变量包括拥堵效应和服务可用性的相对影响，这对需求变化有很大影响。此外，站点类型被编码为数字，以便更好地区分公共和私人充电设施。然后，这些更改被实施到基于XGBoost算法的梯度提升模型中。其次，XGBoost模型基于三个特征进行训练：2025年的人口、端口数量和站点类型（编码）。通过参数调整优化了模型，获得了显著更好的R2（0.76）、RMSE（约42,353）和MAE（28,159），表明预测的准确性很高。新的模型预测有效性通过统计和图形方式进行了验证。如图11所示，实际需求值与改进模型预测的值非常吻合。这些值与理想拟合线（y=x）非常接近，表示偏差很小。不同类别站点的颜色编码显示了无论基础设施是公共还是私人所有，其性能都是一致的。进行了残差分析以测试预测的稳定性。图12给出了实际需求与预测需求的残差图，残差值在y轴上均匀分布，这意味着预测没有偏差。此外，没有显著的异常值，表明误差是随机的。图13给出了SPDI因素的残差图，可以看出在高SPDI区域实际需求较高，这意味着SPDI因素在预测EV充电需求方面起着重要作用。性能指标已证明改进后的XGBoost模型的有效性，如表15所解释的。解释能力很高，这从R2的高值（0.76）可以看出。此外，RMSE和MAE的值分别为42,353和28,159，表明与默认的随机森林模型（R2=0.3）相比，预测误差显著降低。这些结果支持了模型的可靠性和稳定性，从而验证了结合基于空间的特征和使用XGBoost进行优化的益处（见图12和图13）。下载：下载高分辨率图像（138KB）下载：下载全尺寸图像图11. 模型预测与实际需求（y=x参考线已显示）。表15. 改进后的XGBoost模型的关键性能指标。指标值R2 0.76 RMSE 42,353 MAE 28,159下载：下载高分辨率图像（115KB）下载：下载全尺寸图像图12. 残差分布（以零为中心）。下载：下载高分辨率图像（121KB）下载：下载全尺寸图像图13. 实际需求与SPDI（每个充电端口的人口）。尽管XGBoost在预测准确性上优于基线随机森林模型，但本研究没有进行计算基准的深入分析，以评估两种算法的执行时间或训练速度。随机森林具有并行树构建的优势，而XGBoost依赖于顺序提升优化，这可能导致更高的计算成本。然而，由于本研究使用的地区级数据有限且汇总，计算效率的变异性没有得到充分评估。因此，选择这些模型主要是基于它们的预测能力和解释效果，而不是计算速度。与最先进的估算方法进行比较性能评估最近在电动汽车充电需求预测方面的发展揭示了不同机器学习、深度学习和混合方法在解释复杂的时间和空间充电趋势中的应用。为了应对数据可用性的变化，现代研究采用了基于提升的集成模型、循环和变换器架构以及基于图的时空网络和迁移/元学习方法。总体而言，这些模型在预测目标变量的准确性方面被发现比传统的统计模型更有效，这是通过R2值、RMSE和MAE来衡量的。然而，性能的强度可能因数据集的详细程度、特征工程的复杂性、空间维度和预测范围而异。下表16提供了先前代表性估算方法与当前研究之间的比较分析，以了解所提出的基于空间的代理XGBoost框架与当前最先进技术相比的工作方式。由于数据集的大小、时间段的精确度和目标变量的定义不同，应谨慎进行研究之间的直接指标比较。表16. 与最新电动汽车充电模型的比较性能。参考数据集/背景方法预测范围关键指标[73]多城市EVCS数据集XGBoost + 强化学习短期R2 ≈ 0.84[74]自适应充电网络（加州理工学院/喷气推进实验室）混合LSTM-Transformer中期MAE ↓17%，MSE ↓19% vs 基线[75]公共电动汽车充电数据集多模型ML比较多时段变换器 & LSTM最低误差[76]数据稀缺的电动汽车负载迁移 & 元学习短期24–61%的误差减少 vs 传统ML[77]现实世界EVCS（自适应充电网络）堆叠XGBoost– 双向LSTM每小时R2 = 0.6395[78]季节性电动汽车充电负载粒子群优化 ?LSTM混合长期显著降低MAE vs LSTM[79]城市电动汽车充电数据集TCN-LSTM网络短期约6–8%的RMSE减少本文开罗（地区级代理数据）XGBoost（基于空间代理的ML框架）空间预测R2 = 0.76，RMSE = 42,353，MAE = 28,159尽管最近的研究结果很有前景，但大多数现有的预测模型仍然严重依赖于高分辨率的时间充电历史、智能电表数据或运营充电网络接收的实时交易数据。本文提出了一个基于地理信息的代理ML模型，适用于数据受限的环境，其中没有完整的充电会话数据。所提出的XGBoost模型基于社会经济、基础设施和流动性变量来创建复合空间需求指数（SPDI、CAS和CDI），这些指数可以充分代表不同地区的需求差异，而不受历史充电记录的影响。这种方法的转变保证了在像开罗这样的新兴市场和基础设施及历史数据稀缺的城市中有效预测需求的能力。所提出的模型具有很高的预测能力，因为R2值为0.76，即使在文献中报告的深度学习方法等数据密集型模型中也是如此。这证明了结构化代理特征工程方法和集成学习方法的有效性。因此，所建议的方法可以在不确定性和信息稀缺的情况下应用于战略性的电动汽车基础设施规划。所提出框架的可扩展性所提出的基于空间代理的框架的可扩展性在于其聚合建模结构。它使用复合空间指标而不是高频充电会话记录来在地区级别运行预测过程。因此，该模型不依赖于时间递归、顺序记忆或站际网络连接，这些通常伴随着更高的计算和结构复杂性。所提出的框架在多个方面具有可扩展性，包括空间扩展、特征维度的稳定性、计算效率以及架构可扩展性，如表17所总结的。其现有结构具有固定的特征结构和自主的空间处理单元，可以以受控和线性的方式扩展行为，与需要针对时间或网络复杂性的增加而进行结构不同调整的时间变化预测模型不同。此外，通过使用统一的社会经济和基础设施指标，地理可转移性得到了增强。将框架扩展到其他大都市区的主要要求是使用当地可用数据重新计算复合指数。这一特点使得该框架特别适合在新兴市场和数据稀缺的环境中进行电动汽车基础设施的规划。表17. 所提出框架的可扩展性特征。空单元所提出框架的可扩展性维度1. 空间扩展独立地区级单元能够按比例扩展到其他区域。2. 特征维度恒定的复合指标结构（SPDI、CAS、CDI）3. 计算结构基于树的梯度提升与并行CPU处理4. 数据依赖性不依赖于高频充电会话日志5. 扩展时不需要进行架构修改6. 可转移性适用于使用公开可用的社会经济和基础设施数据的其他城市7. 操作适应性模型可以根据更新的指标定期重新训练。表18. 开罗各区电动汽车充电压力的SPDI分类。区域人口人口密度SPDIC分类Boulaq 52,003 9286 26,002 低压力Hadaieq Al Qobba 341,321 26,255 85,330 高压力Al Waily 163,273 11,662 32,655 低压力Al Zaher 82,000 41,000 82,000 高压力Al Khalifa 113,632 16,233 37,877 低压力Nasr City 763,278 305 314,966 低压力Zeitoun 188,123 30,840 188,123 高压力Misr Al Gadida 144,832 16,092 72,416 中等压力El Mokattam 242,009 672 248,402 中等压力Helwan 562,889 8660 562,889 高压力El Nozha 249,714 1864 11,891 低压力Al Maadi 95,675 478 47973 低压力Al Basateen 534,858 44,572 178,286 高压力El-Salam 685,047 26,348 137,009 高压力Katameya 76,523 478 325,508 低压力第五定居点-新开罗 146,655 1630 29,331 低压力表15显示了所提出框架的可扩展性，这可以通过复合特征的空间是恒定的以及空间结构是无尺度的事实来解释。这将保证在添加更多区域时计算的可管理扩展。此外，由于不需要高频充电数据，所提出的框架在数据受限的环境中的适用性得到了增强，因此不需要任何结构上的改变。空间预测和映射为了确定适当的地理空间表示，预测的充电需求通过UTM坐标系统（Zone 36 N）在开罗各区进行空间叠加，为描述性和建模分析提供了另一种工具。根据需求压力的水平，这些区域被分为三个需求压力类别：高需求区、中等需求区和低覆盖区。值得注意的是，尽管像Zeitoun和Al Zaher这样的地理上较大的区域有较高的SPDI值，这表明这些区域是基础设施不足的热点。相反，像Nasr City这样较大的区域，人口与充电基础设施的比例更为均衡，意味着需求压力适中。此外，低人口密度区域的需求压力较低，这表明在这些区域发展基础设施不是优先事项，与高密度区域相反。这强调了在电动汽车情况下制定地理信息驱动的基础设施发展计划的必要性。此外，充电需求的地理空间映射不仅识别了边缘化区域，还为城市规划者提供了关于在哪些区域优先发展基础设施的重要信息。图14直观地表示了各区需求的分布，表13指出了各区需求压力的分类。下载：下载高分辨率图像（89KB）下载：下载全尺寸图像图14. 基于SPDI的电动汽车充电需求的地理空间分布。图18将展示开罗各区根据SPDI值的需求压力分类，分为三类：高压力（>80,000人/端口）、中等压力（40,000–80,000人/端口）和低压力（<40,000人/端口）。研究结果表明，像Zeitoun和Al Zaher这样压力较高的地区基础设施负担较重。在其他情况下，一个充电站需要服务超过180,000人。这些地方需要立即发展基础设施。另一方面，像Hadaieq Qobba和Al Waily这样的中等压力区域，每个端口的需求为40,000到80,000人，这意味着基础设施问题较高，但相对较小。通过短期内关注这些区域的发展，未来的拥堵将会缓解。最后，像Nasr City和一些偏远地区这样的低压力区域，每个端口的人口少于40,000人，基础设施与人口的比例较为有利。这些地方提供了相对较好的充电覆盖，但需要规划。最后，分类显示了明显的地理不平衡，高密度中心区域应优先考虑并立即采取干预措施，而中等和低压力区域将采取逐步扩展策略。比较见解和政策含义我们在地区层面的社会空间随机森林结构与越来越多的文献一致，即机器学习模型，特别是树集成模型，在电动汽车充电需求/位置问题上比更基本的基线模型表现更好，并且可以解释为在规划中有用。一个大规模的城市级实验证明，与其他机器学习算法相比，随机森林是最适合的EVCS密度分类预测模型，这解释了在数据有限的环境中选择RF模型的原因[59]。此外，在最近关于EVCS选址方法的系统和范围更广泛的审查中，明显出现了向后者转变的趋势，即从传统的基于GIS的叠加分析、基于时间序列的基线（例如，自回归积分移动平均）转向基于ML的、辅助优化的方法，特别是在空间异质性较高的领域[80]。从政策和公平性的角度来看，我们基于SPDI的地图绘制并不是现有文献中关于公共充电可访问性存在空间不平等以及需要关注弱势或高密度区域的第一个参考。最近的综合研究和实证研究表明，充电的分配不均衡，而在服务不足的社区部署特定充电器可以在电动汽车采用和系统可靠性方面产生不成比例的更大收益，这使我们关注高SPDI区域[81]。系统层面的宏观趋势强调了规划的紧迫性。国际能源署预测，本十年公共充电的需求将增加数倍，这意味着城市投资需要转向地理信息驱动和需求敏感的工具，以防止低效或不合理的建设——这正是我们的地区预测和SPDI分类所能做的[82]。最后，使用人口与充电端口数量的比率作为需求代理指标的做法与最近的数据稀缺方法一致，特别是在全球南方，直接使用数据通常不可用，最近的研究建议使用迁移和知识高效的学习或基于模拟的规划来填补数据空白，进一步支持我们的低成本诊断工作流程[83]。本文提出了连续的政策建议，以加强电动汽车（EV）充电基础设施的战略布局，这是基于本文所发展的空间分析。首先，应优先考虑SPDI值最高的区域，以便立即扩大基础设施。为了确保不同EV型号的互操作性并避免与兼容性相关的瓶颈，这些区域的连接多样性必须保持在最低水平。在SPDI得分中等的区域，建议采用分阶段升级计划。逐步增加充电站的数量有助于充分利用现有资源，并将特定区域充电站过多的可能性降到最低。然而，技术考虑不应成为基础设施设计的基础。社会因素也必须予以考虑，例如该区域每平方公里的居民数量、居民的经济舒适度以及人们居住的住宅单元类型。现有研究似乎都强调了在设计基础设施时考虑人口社会人口统计因素的重要性，以确保其不会产生偏见。最后但同样重要的是，研究强调了实施持续监控系统的重要性，该系统将由预测性机器学习（ML）模型支持。这将使政策制定者能够每年调整部署目标，从而使基础设施发展与当地需求模式的变化以及国际组织（如国际能源署IEA）定义的国际路径保持一致。这种一致性对于确保国家计划与总体脱碳目标之间的协调至关重要。

在描述性分析中，2025年和2030年各区的人口统计数据将与充电站的特征相结合，以重新评估开罗的EV充电基础设施。目前，已经定位了209个充电点。这些连接器分为七种类型：AC（类型2）连接器是最常见的类型，占77.5%，即162个终端；CCS2占10.5%，CHAdeMO占7.2%。其余连接器占不到5%，包括类型10、Wall（Euro）和GB/T。这种不匹配是系统内缺乏互操作性的重要指标，因为它们主要是为符合欧洲标准的EV设计的，与亚洲和北美的车辆兼容性很低。大多数设施只包含一个或两个插座，这意味着技术能力继续限制了每个设施的平均终端数量。这导致高密度区域的拥堵加剧。考虑到人口压力，显然存在显著差异。如图15所示，Ain Shams和Dar Al Salam的公民与充电站的比例非常高，2025年时每个充电站的服务人数超过了25万人，但预计到2030年这一数字会下降。相反，人口较少的区域（如Abdeen（43,566名居民）和El Shorouk（94,228名居民）的覆盖率相对较高。2025年和2030年的综合分析表明，不平等现象不仅持续存在，而且随着时间的推移还会加剧，特别是在Dar Al Salam、Ain Shams和Helwan等边缘地区。与此同时，中心区域的比率更为理想，这支持了城市核心的优势。表19总结了按连接器类型和充电模式划分的充电站分布情况。大多数是类型2 AC充电器（n=162），而DC快速充电器（如CCS2，22个端口）和CHAdeMO（15个端口）较少。这表明基础设施仍以较慢的AC解决方案为主，高功率DC快速充电设施的使用极少。总体而言，开罗的EV充电情况存在三个结构性问题：依赖类型2 AC充电器，快速充电技术的部署不足；站点规模小，吞吐量有限；空间不平等现象加剧：服务不足的边缘地区承担了不成比例的人口负担，预计到2030年情况会恶化。

下载：高分辨率图片（363KB）
下载：全尺寸图片

图15. 2025年与2030年开罗各区的人口与充电站比例，显示中心区域和边缘区域之间的持续和扩大的差异。
表19. 开罗按连接器类型和充电模式划分的EV充电站分布。

连接器类型 | 充电模式 | 端口数量
--- | --- | ---
类型2 AC充电 | 162 |
CCS2 | DC快速充电 | 22 |
CHAdeMO | DC快速充电 | 15 |
类型1 AC充电 | 4 |
Wall（Euro） | AC充电 | 3 |
GB/T（快速） | DC快速充电 | 1 |
总计 | 209 |

这些发现为使用RFR进行预测建模提供了实证基础，旨在确定服务不足的关键区域并预测未来需求情景下的基础设施需求。

将建议的AI模型应用于开罗的EV充电基础设施后，得出了各区的广泛访问评分。该模型强调了城市区域内服务公平性的巨大差异，结合了人口统计数据、充电站的可用性和空间权重变量。如图16所示，包括First Settlement – New Cairo、Abdeen和Maadi在内的某些区域的AI值较高，这主要是因为这些区域的充电终端数量较多且邻近性权重较好。这些发现表明这些区域的充电站分布较为均匀，可能是自然发展或规划的结果。相比之下，许多区域的基础设施不平等现象严重，如Helwan、Basateen和Dar El Salam的评分较低，这可能是由于人口密度高、充电站分布不佳或地理位置难以到达所致。预期的政策措施可以为这些服务不足的地区带来巨大机会。此外，图表显示访问分布呈右偏态，很少有区域显示出高基础设施水平，大多数区域位于AI较低范围内。因此，这种不对称性突显了在进一步实施计划中优化资源和空间重新分配的重要性。最后，AI作为一种有用的衡量工具，可以量化并可视化EV基础设施分布的差异，使政策制定者能够超越简单的站点数量统计，考虑整个城市环境的人口调整空间加权规划。

下载：高分辨率图片（309KB）
下载：全尺寸图片

图16. 开罗各区的AI评分。

上述需求估算模型还提供了有关开罗EV充电基础设施在运营压力下的响应情况的更多信息。使用实际需求（区人口与可用充电站数量的比例）和预测需求（根据站点类型进行加权调整）作为标准，该框架展示了使用情况的显著变化。图17是一个比较条形图，比较了实际需求和预测需求，从而显示了预测的充电压力与建模基础设施功能之间的差异。在不同地区，预测需求始终低于实际需求，这表明基础设施在充电操作方面的效率存在假设。然而，在私人或混合充电站密度较高的地区，预测需求与实际值更为吻合，表明每个站点的压力更大。残差的大小及其分布也支持了这些观察结果，如图18所示。在高人口密度地区，站点容量有限，服务短缺情况严重；而在基础设施完善且拥有多个终端的地区，残差最小，因此显示了基础设施实施的关键作用。这些研究的结果表明，基于需求的评估是必要的，因为简单的站点数量统计并不能反映人口密度、基础设施类型及其可用性的多方面相互作用。将需求估算引入规划框架将有助于未来EV充电网络的发展，不仅涵盖地理范围，还确保新网络的公平性和效率。

下载：高分辨率图片（396KB）
下载：全尺寸图片

图17. 各区实际需求与预测需求的比较。

下载：高分辨率图片（119KB）
下载：全尺寸图片

图18. 各区预测与实际EV充电需求的残差分布。

**讨论**
RFR模型的结果提供了社会空间解释和预测。即使没有开罗的实时定价信息，模型结果也清楚地表明了基础设施分布的差异。SPDI值非常高的区域受到严重限制，因为预期需求超过了当前基础设施的服务能力，因此需要立即采取措施。低SPDI区域的比率相对适中，有利于投资；而中等SPDI区域则有可能成为拥堵热点，除非采取行动。这些发现强调了使用社会空间数据和ML进行城市基础设施预测的重要性。

与现有文献的比较
研究结果与世界数据一致，表明基于集成的ML在模拟非线性需求动态方面可能优于传统的统计和GIS方法。比较显示，随机森林在不同空间分辨率下的表现优于神经网络替代方案[84]。同时，对随机森林的算法改进（如元启发式调优）提高了充电负荷预测的准确性，从而证实了其在数据匮乏的规划环境中的适用性[85]。系统评估的结果表明，使用静态叠加方法和简单的时间序列建模与使用ML和优化算法的EVCS规划模型之间存在方法论上的差异[86]。

**ML的鲁棒性和结构验证**
所提出框架的合理性可以通过ML视角下的各种算法结构来确定。初始非线性参考点的结果是基于随机森林算法构建的基线模型的表现，尽管其解释能力较低（R2=0.30）。在XGBoost中加入工程空间指标后，模型性能显著提升（R2=0.76），这表明模型能够捕捉复杂的社空间交互作用，而这些交互作用是基于bagging的集成模型无法有效处理的。性能的提高表明模型能够减少偏差并保持方差。此外，特征重要性的检验结果揭示了人口规模和站点密度的一致性，证明所揭示的关系并非偶然。尽管CDI的预测价值较低，但其基础设施价值仍然显著，因为它能够区分重要和无关变量。尽管CDI的预测价值较低，但其基础设施价值并未因此减弱。特征重要性用于衡量对SPDI方差的贡献，但连接器多样性在确保互操作性、技术包容性和系统长期适应性方面起着结构性作用。也就是说，它不仅使政策具有时效性，还暗示了操作韧性因素，而不仅仅是方差主导。另一个值得注意的关键方面是，预测输出和空间压力分类/SPDI阈值是一致的，访问性诊断是算法一致性的指标，而非模型行为本身。此外，所提出框架的内部有效性得到了验证，因为在各种分析要素中都识别出了相同的高压力区域。这表明决策模式和强烈的学习行为是该策略的特征。因此，它提高了城市基础设施预测方法的可信度和实际可靠性。

**政策和规划意义**
基于SPDI对区域进行实证分类的计划具有直接的规划意义。通过优先在高压区域部署公共充电设施，可以解决最紧迫的不足；而在中等压力区域进行定期改进将有助于避免未来的拥堵问题。最近的研究表明，公共充电站的可获得性仍然存在显著的不平等。因此，在规定这些充电站的选址时，必须纳入公平因素，以及人口密度、收入水平和住房类型等因素。这将有助于避免不平等状况的进一步加剧[87]、[88]。本文所展示的这种基于地理信息的、对需求敏感的工具的需求更加迫切，因为国际评估指出，在本十年内公共充电网络需要迅速发展[82]。

**研究的局限性**
需要注意的是存在一些局限性。首先，使用的是需求的一个代理指标，即人口与可用充电端口的数量之比，而没有考虑充电行为的时间变化，如高峰负荷期、平均停留时间和区域间的车辆流动模式。其次，区域分析可能会掩盖区域内的异质性。第三，该模型没有包括影响技术可行性的电网容量变量。最后，虽然对社会人口统计数据进行了预测，但这些数据相对稳定，可能无法跟上电动汽车采用或迁移的快速变化。这些局限性促使我们需要在未来的工作中采用更多数据丰富的方法，并更紧密地整合能源移动性。

**未来研究方向**
未来的研究应使用实时交易数据以确保外部有效性；比较随机森林与梯度提升（XGBoost、LSTM/GCN）架构；将选址和电网优化作为一个多目标问题来平衡需求满足、公平性、成本和环境性能；应用跨城市的迁移学习，以便在数据稀缺地区更快地部署充电设施；并进行多目标优化，以平衡需求满足、公平性、成本和环境性能。

**结论**
本文提出了一种数据驱动的、以区域为导向的方法，用于预测开罗大都市区电动汽车（EV）充电的需求。首先构建了随机森林回归（RFR）模型，该模型涉及社会人口统计、基础设施和地理变量。然而，该模型的表现不佳，这突显了数据有限的城市地区进行需求预测的挑战。为了克服这些缺点，引入了XGBoost算法，并补充了按需求指数（SPDI）划分的工程变量以及关键的人口统计和基础设施变量。这种新方法显著提高了模型的性能，R2=0.76，RMSE约为42,353，MAE约为28,159。上述指标表明改进后的模型具有更强的预测能力，更适合电动汽车基础设施的空间分布分析。特征工程在揭示与服务可及性、人口密度和基础设施分布相关的隐藏差异方面发挥了重要作用。空间诊断显示了基础设施压力水平的三个分类等级：
- **高压区域**：每个充电端口服务超过180,000名居民；
- **中等压力区域**：每个充电端口服务40,000至80,000名居民；
- **低压区域**：每个充电端口服务少于40,000名居民。
这些阈值将作为优先级设定工具，用于基础设施项目，符合效率和公平性的原则。此外，通过聚类分析识别出服务不足的区域，从而提高了未来干预措施的空间精度。从方法论的角度来看，所提出的框架相比传统的统计方法或仅使用GIS的方法具有某些优势，主要体现在成本效益、多功能性和可解释性方面。然而，该系统的优势并非没有限制，最明显的问题包括缺乏细粒度的时间数据、依赖代理需求指标以及无法获取实时电网容量数据。鼓励进一步的研究关注使用动态数据流、充电活动的实时记录、电动汽车拥有量预测和电网灵活性模拟，以提高运营重要性、政策相关性和预测准确性。总体而言，开发的框架可以作为一种可转移的、基于证据的工具，供城市规划者和政策制定者使用，以促进在像开罗这样空间不平等严重的快速城市化城市中公平和可持续地部署电动汽车充电基础设施。

**动机**
尽管向电动交通的转型进展迅速，但像开罗这样的一些快速增长的城市并没有一个积极主动、数据驱动的系统来促进电动汽车（EV）系统的公平实施。现代规划策略往往对地理不平衡和真实需求信号反应不足。本文通过建立一个可扩展的、空间明确的预测平台来填补这一空白，该平台可以在数据有限的城市环境中公平高效地设计基础设施。

**CRediT作者贡献声明**
M. Saber Eltohamy：撰写——原始草稿，概念化；
Ali. M. El-Rifaie：撰写——原始草稿，调查；
Ahmed A.F. Youssef：撰写——原始草稿；
Oussama Accouche：撰写——原始草稿；
M. Hassan Tawfiq：验证，方法论；
S. Wahsh：撰写——原始草稿；
Hossam Youssef：撰写——原始草稿；
Amir Raouf：验证，资源；
Junaid Ali Khan：撰写——审阅与编辑，监督；
M.M.R. Ahmed：撰写——审阅与编辑，监督。

热点排行