编辑推荐:
为解决家庭能源利用优化问题,研究人员开展 SHEERM 数据集研究,助力可再生能源发展。
在全球倡导可持续发展的大背景下,家庭能源的合理利用与管理成为关键议题。随着人们对生活品质要求的提高,家庭能源消耗不断增加,传统能源的使用带来了环境污染和资源短缺等问题。与此同时,太阳能等可再生能源的开发利用虽有进展,但在实际应用中仍面临诸多挑战。例如,现有的相关数据集存在数据缺失、信息不完整、缺乏多变量整合等问题,使得难以全面深入地研究家庭能源消耗与生产的关系,也无法为能源政策的制定和能源系统的优化提供有力支持。
为了攻克这些难题,来自葡萄牙里斯本大学 LASIGE 的研究人员 José Cecílio、Tiago Rodrigues、Márcia Barros 和 Alan Oliveira de Sá 展开了深入研究。他们致力于创建一个独特而全面的数据集,以推动可持续家庭能源与环境资源管理(Sustainable Household Energy and Environment Resources Management,SHEERM)的发展。相关研究成果发表在《Scientific Data》上。
研究人员采用了多种技术方法来构建和验证 SHEERM 数据集。在数据采集方面,通过在葡萄牙不同地区的 13 个家庭安装智能电表,收集家庭能源消耗数据;从 Ember Climate 网站获取电网能源价格数据;利用国家太阳能辐射数据库(NSRDB)提供的天气数据,以及选定商业太阳能面板收集太阳能发电数据。在数据处理过程中,运用了线性插值、神经网络等技术对数据进行清洗和预测,去除异常值并填充缺失数据。同时,使用 Python 编程语言及相关库,如 Pandas、NumPy、Matplotlib、Scikit-learn 和 TensorFlow 等,开发和训练机器学习模型,对数据进行深入分析和验证。
数据记录
SHEERM 数据集主要包含四个部分:家庭消费数据(Load)、电价数据(Price)、天气信息(Weather)和光伏发电数据(PV Generation)。家庭消费数据涵盖 13 个家庭,以 CSV 文件形式存储,包含日期、时间和家庭电力消耗等变量,经过处理后缺失数据和异常值得到有效处理。天气数据按每个家庭位置获取,包含多种气象变量,时间跨度为 2021 - 2024 年,每 15 分钟记录一次。电价数据来自 Ember - climate 网站,包含 2015 - 2024 年的葡萄牙市场电价信息,每小时记录一次。光伏发电数据与每个家庭的太阳能面板相关,包含时间戳、太阳入射角余弦值、全球水平辐照度(GHI)和光伏发电功率等变量。
技术验证
- 家庭消费数据:通过线性分析评估数据特征,发现小窗口数据多呈线性模式,大窗口数据则为非线性模式。使用长短期记忆网络(LSTM)、随机森林回归(RFR)、极端梯度提升(XGBoost)和多层感知器(MLP)等算法进行预测,结果表明 LSTM 模型在预测家庭负载值方面表现更优,R2值显示其预测数据与真实数据相关性良好。
- 天气和光伏发电数据:将 SHEERM 数据集中的 GHI 与其他数据集对比,并通过实际实验验证其可靠性。利用 LSTM 模型预测太阳辐照度,随机森林分类器(RFC)预测云类型,评估指标显示模型预测效果良好,证明了数据的可用性和准确性。
- 市场能源价格数据:同样使用上述四种机器学习模型预测家庭消费和市场电价,结果显示 LSTM 模型表现最佳。尽管预测值与实际值存在偏差,但趋势一致,表明数据可靠,可用于设计新的能源系统。
数据相关性分析
通过对不同地区两个家庭(House 1 和 House 3)的案例分析,研究人员发现家庭能源消耗与外部温度的关系因地区而异。House 1 位于中央沿海地区,温度降低时能源消耗增加;House 3 位于葡萄牙中部,温度升高时能源消耗增加。同时,分析表明家庭能源消耗与能源市场价格无关,而光伏发电能力与太阳辐照度呈正相关。
研究结论与意义
SHEERM 数据集为家庭能源与环境资源管理提供了全面、综合的数据支持。通过对该数据集的分析,研究人员深入了解了家庭能源消耗、太阳能发电、天气条件和能源市场价格之间的复杂关系。这不仅有助于优化太阳能能源生产和分配,实现可持续发展目标(SDG)中的第 7、9、11 和 13 条,还能为政府制定相关政策、推动可再生能源发展提供有力依据。此外,该数据集还可用于开发更准确的能源预测模型,促进能源技术创新,提高能源利用效率,对实现全球向可再生能源和碳中和的转型具有重要意义。
综上所述,SHEERM 数据集的创建和分析为家庭能源管理领域带来了新的突破,为可持续能源发展提供了宝贵的数据资源和理论支持,有望推动相关领域的进一步研究和实践。