
-
生物通官微
陪你抓住生命科技
跳动的脉搏
中国电动汽车充电交易多维特征高分辨率数据集:行为分析与故障预测的新基准
【字体: 大 中 小 】 时间:2025年04月17日 来源:Scientific Data 5.8
编辑推荐:
为解决EV充电数据存在的不完整性、偏差性和实时性缺失问题,东南大学联合国家电网浙江公司团队构建了覆盖13个充电站、44万条交易记录的实时数据集,集成充电状态、终止原因及气象等多维特征。该数据集为充电设施规划、充放电管理及经济评估提供精准数据支撑,相关成果发表于《Scientific Data》。
随着全球碳中和进程加速,电动汽车(EV)作为交通领域减排的关键载体正迎来爆发式增长。国际能源署(IEA)数据显示,2023年全球EV销量达1400万辆,占汽车总销量的18%。然而,充电基础设施的优化布局与智能管理仍面临重大挑战——现有充电交易数据集普遍存在三大痛点:用户隐私保护导致的数据残缺、充电运营商间复杂耦合关系引发的数据偏差、以及实时监控信息的匮乏。这些缺陷严重制约了充电站布局优化、用户行为分析和负荷预测等关键研究。
针对这一瓶颈,东南大学智能电网技术与装备江苏省重点实验室联合国家电网浙江桐乡供电公司团队,在《Scientific Data》发布了中国首个集成多维特征的高分辨率EV充电交易数据集。该研究历时两年,采集自嘉兴市13个充电站的441,077条实时交易记录,创新性地融合了充电时序数据(精确到秒)、电价策略、终止原因(包括用户主动停止、电池充满、系统故障等7类衍生变量)以及网格化气象数据(0.1°×0.1°分辨率)。通过严格的K-S检验验证,清洗后的数据在充电量(D=0.00006)、费用(D=0.00006)等关键指标上保持原始分布特征,异常数据剔除率仅0.022%。
研究团队采用工业级数据采集设备(符合IEC 60870-5-104协议),通过4G/蓝牙双模通信实现5分钟级数据上报。设备在-25℃至55℃环境下的时钟误差≤0.5秒/天,电流测量精度达1.0级。数据预处理包含四步关键操作:用户ID随机映射的匿名化处理、网络中断导致的缺失记录剔除、充电量超过电池容量的逻辑校验、以及基于GB/T 27930-2015标准的终止原因编码转换。气象数据则通过中国气象数据服务中心(CMDSC)的站点观测插值获得。
时空行为分析揭示,城市快慢充桩使用呈现显著差异:快充桩在8-11时、19-21时两个电价高峰段(分别为0.9014¥/kWh和1.2064¥/kWh)负载集中,而慢充桩在22时至次日8时低谷电价期(0.3784¥/kWh)利用率提升35%。通过K-means聚类发现,高速公路服务区因长途出行特性,慢充桩使用频次仅为市区的17%。研究还量化了COVID-19疫情影响:2020年一季度封锁期间,充电异常率(Is_abnormal)较2021年恢复期上升31.7%(p=3.87×10-64),这与运维人员流动受限直接相关。
故障诊断方面,数据集首次建立气象参数与设备故障的关联模型。数据显示9月高温高湿期(平均温度28.6℃、相对湿度82%)单日故障率较年均值增加2.3倍,其中交流故障(Is_nonsystem_fault)占比达54%。与ACN Data等国际数据集对比,本数据集平均单次充电量(18.91kWh)更接近韩国参考数据集(17.44kWh),但最大充电量(117.74kWh)反映出中国EV电池容量的大型化趋势。
该研究的核心价值在于构建了首个覆盖充电全生命周期多维特征的标准化数据集。其创新点体现在三方面:首次将终止原因分类(用户行为)与气象因素(环境变量)纳入分析框架;通过设备级实时监控确保数据精度(电流测量误差≤0.004Ib);采用空间插值技术实现气象数据与充电站点的精准匹配。这些特性使其在四大应用场景展现独特优势:基于用户停止行为(Is_user_stop)的充电桩布局优化、结合TOU电价的动态定价策略验证、考虑温度/湿度影响的电池衰减建模、以及多故障模式(Is_EV_fault/Is_system_issue)的设备可靠性评估。
研究团队在讨论中指出,当前数据集的局限性在于地理覆盖集中于长三角城市群。未来计划通过联邦学习技术,在保护用户隐私前提下实现跨区域数据协同。该数据集已开源发布于Figshare平台(DOI:10.6084/m9.figshare.28182251.v3),配套Python3.10分析脚本可支持充电负荷预测、故障诊断等衍生研究,为全球EV基础设施的智能化升级提供中国方案。
生物通微信公众号
知名企业招聘