AutoEnergy:面向能耗预测的自动化特征工程方法及其在AutoML中的集成应用

【字体: 时间:2025年08月27日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  本研究针对能耗预测(ECF)中特征工程(FE)依赖专家知识、耗时且易出错的问题,提出了自动化特征工程方法AutoEnergy。该方法通过基于规则的转换自动从时间戳和历史能耗值中生成可解释特征,并与AutoML集成实现全自动化建模。在18个真实能耗数据集上的实验表明,AutoEnergy相比基准方法将预测误差降低了19.52%至84.72%,运行速度比FeatureTools和TSEfficient分别快1.31倍和4.41倍,显著提升了AutoML在能耗预测领域的性能与效率。

  

在能源管理领域,准确预测能源消耗量(Energy Consumption Forecasting, ECF)对电网调度、能源规划和节能减排具有重要意义。然而,传统机器学习方法在能耗预测中面临一个关键挑战:特征工程(Feature Engineering, FE)过程高度依赖领域专家知识,既耗时又容易引入人为偏差。虽然自动化机器学习(AutoML)技术已经能够自动完成模型选择和超参数优化,但在特征工程环节仍然需要大量人工干预,这成为实现全自动化机器学习管道的主要瓶颈。

特别是在能耗预测这种专业领域,数据具有明显的时间序列特性,包含复杂的线性与非线性关系、波动行为以及时间与环境因素的依赖关系。现有的通用AutoML系统由于注重泛化能力,在专门领域往往效果有限,而深度学习等方法虽然能自动学习特征表示,但缺乏可解释性且需要大量数据支撑。这就迫切需要开发一种能够自动生成可解释特征、减少人工干预的领域专用特征工程方法。

为了解决这一问题,来自英国诺丁汉大学和利兹大学的研究团队在《Knowledge-Based Systems》发表了题为"AutoEnergy: A Proxy-Domain-Guiding Strategy for Multi-Source-Free Domain Adaptation in EEG Emotion Recognition"的研究论文。研究人员开发了AutoEnergy这一新型自动化特征工程算法,专门针对能耗预测问题进行了优化设计。

本研究采用了多种关键技术方法:首先基于18个来自住宅、商业、工业和电网等不同领域的真实能耗数据集进行验证;其次设计了基于Kendall's tau相关性检验的统计显著性特征选择方法;采用了傅里叶变换进行周期性特征编码;开发了滞后特征和嵌套窗口特征自动生成算法;使用AutoGluon和TabPFN两种AutoML框架进行性能评估;并通过Friedman检验和Wilcoxon符号秩检验进行统计显著性分析。

2. AutoEnergy: 提出的特征工程方法

研究人员提出了一个完整的自动化特征工程框架,该框架通过一系列特征生成函数处理时间戳和目标变量(历史能耗值)。算法主要包含两个核心部分:时间特征、正弦和余弦变换衍生特征(Algorithm 1)以及滞后和嵌套窗口特征(Algorithm 2)。这种方法能够自动识别统计显著的滞后项,并计算多个时间尺度上的滚动统计量,有效捕捉能源时间序列数据中的时间依赖性和多尺度统计特征。

4. 结果与分析

4.1. AutoEnergy对AutoML预测性能的影响

实验结果表明,AutoEnergy显著提升了AutoML在能耗预测中的表现。与没有特征工程的基线相比,AutoEnergy将归一化均方根误差(nRMSE)平均降低了83.22%,改进幅度从Appliances数据集的28.22%到PJME数据集的98.39%不等。预测稳定性也提高了53.69%,表明AutoEnergy能够有效提升AutoGluon的预测准确性。

4.2. 与基准方法的比较

在与现有特征工程方法的比较中,AutoEnergy表现出最优异的性能。其平均nRMSE为0.0338,相比FeatureTools(FT)、TSMin和TSEfficient分别降低了19.52%、82.38%和77.98%。在计算效率方面,AutoEnergy平均处理时间为471.94秒,比FT快1.31倍,比TSEfficient快4.41倍。

4.3. 计算效率和敏感性分析

研究表明,AutoEnergy在处理大型数据集时保持了计算可行性,特别是在样本量超过14万的数据集上仍能有效运行。更重要的是,AutoEnergy在小数据集上表现尤为出色,这对实际应用中常见的数据有限情况具有重要意义。

4.4. 特征重要性和统计检验分析

通过特征重要性分析发现,AutoEnergy生成的特征具有最强的预测能力,其中统计显著的滞后项和嵌套窗口特征是最主要的预测因子。统计检验结果进一步证实了AutoEnergy的优越性,Friedman检验显示各方法间存在显著差异(p<0.001),AutoEnergy在nRMSE方面获得最佳平均排名(1.06)。

研究结论表明,AutoEnergy作为一种专门为能耗预测设计的自动化特征工程方法,能够显著提升AutoML的性能表现。该方法通过自动从时间戳和历史能耗值中生成可解释特征,减少了对领域专业知识的需求,在18个不同领域的真实能耗数据集上均表现出优异的预测精度和计算效率。

这项研究的重要意义在于:首先,它解决了能耗预测中特征工程依赖专家知识的核心问题,推动了自动化机器学习在专业领域的应用;其次,AutoEnergy生成的 features 具有良好的可解释性,使能源管理者能够理解模型的预测依据;第三,该方法在计算效率和预测准确性之间取得了良好平衡,特别适合实际工业应用场景;最后,研究展示了领域专用特征工程方法相比通用AutoML系统的优势,为其他专业领域的自动化机器学习提供了重要参考。

该研究的创新点不仅在于单个组件的设计,更在于其战略集成和优化,实现了端到端的自动化能耗预测建模。随着能源管理系统日益复杂和数据量的不断增长,像AutoEnergy这样的自动化特征工程方法将在智能能源管理和可持续发展中发挥越来越重要的作用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号