
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的建筑能效预测Web框架:实现高精度(R2 ≥0.96)与用户友好性(SUS=82.5)的集成解决方案
【字体: 大 中 小 】 时间:2025年06月12日 来源:Franklin Open
编辑推荐:
本研究针对建筑能耗占全球40%的严峻现实,开发了基于Flask的Web机器学习框架,采用随机森林(RF)和线性回归(LR)模型预测建筑冷热负荷。系统在UCI数据集上取得RF模型R2 达0.9914(供热)/0.9623(制冷)的优异性能,结合PCA降维和输入验证,通过50人用户体验测试获得82.5分SUS评分,为建筑师提供了直观的能效设计工具。
在全球建筑能耗占比高达40%的背景下,建筑能效优化成为实现碳中和目标的关键突破口。传统物理模拟方法虽精确但计算成本高昂,而现有机器学习(ML)解决方案多局限于技术专家使用,缺乏面向建筑设计师的友好界面。这种技术鸿沟使得早期设计阶段难以快速评估不同建筑参数的能效影响,导致大量潜在优化机会流失。
针对这一挑战,研究人员开发了基于Flask的Web机器学习框架,创新性地将随机森林(Random Forest, RF)和线性回归(Linear Regression, LR)模型与用户友好界面结合。研究采用UCI Energy Efficiency数据集,包含768组建筑配置数据,涵盖相对紧凑度、表面积等8项静态设计参数。通过系统比较两种算法性能,结合主成分分析(PCA)降维和MinMaxScaler标准化预处理,构建了冷热负荷预测系统。
关键技术方法包括:1) 采用5折交叉验证评估模型泛化能力;2) 基于PCA实现特征降维(保留85%方差);3) 开发包含输入验证和错误诊断的Flask Web应用;4) 通过系统可用性量表(SUS)评估界面设计。
研究结果显示,随机森林模型表现显著优于线性回归,测试集R2
达到0.9914(供热)和0.9623(制冷),较线性回归提升8.1%-7.2%。特征重要性分析揭示建筑高度(权重0.66)和相对紧凑度(0.36)是影响供热负荷的关键因素。通过50名非技术用户的测试,系统获得82.5分的SUS评分,平均任务完成时间仅2.5分钟,证实其良好的可用性。
在模型诊断方面,学习曲线显示随机森林在300+样本量时验证集R2
稳定在0.95(供热)和0.93(制冷),残差分布(-6至6 kWh/m2
)显著优于线性回归(-15至15 kWh/m2
)。敏感性分析发现建筑高度从3.5m增至7m时,供热负荷从15升至35 kWh/m2
,而制冷负荷保持稳定,这种非线性关系被随机森林准确捕捉。
讨论部分指出,该框架的创新性体现在三方面:首先,首次将RF模型与Web界面结合,使R2
0.96的高精度预测可供非专家使用;其次,系统架构支持未来集成动态参数(如天气数据);最后,详细记录了Windows环境部署的依赖管理方案,为同类应用提供参考。研究同时指出,当前PCA处理可能弱化特征间非线性交互,建议未来采用t-SNE或自动编码器等非线性降维方法。
这项发表于《Franklin Open》的研究,为建筑能效设计提供了兼具科学性(R2
≥0.96)和实用性(SUS=82.5)的工具,其模块化设计支持后续扩展动态参数监测和云平台部署。随着全球对绿色建筑需求的增长,该框架有望成为建筑师迭代优化设计方案的标准辅助工具,推动建筑业低碳转型。
生物通微信公众号
知名企业招聘