基于机器学习的分散式雨水收集系统经济可行性评估框架及其全球应用

【字体: 时间:2025年09月12日 来源:Results in Engineering 7.9

编辑推荐:

  本研究针对传统方法难以准确评估雨水收集(RWH)系统经济可行性的问题,开发了一种基于机器学习的预测框架。研究人员利用来自20多个国家、150多个城市的1841个RWH系统数据,训练了包括随机森林(RF)在内的四种机器学习算法。结果表明RF模型在效益成本比(BCR)预测中表现最优(R2=0.906),并通过SHAP分析识别出水价(20.8%)和降雨变异系数(20.5%)为关键影响因素。研究还开发了用户友好的Streamlit网络应用程序,为工程师、业主和政策制定者提供了实用的决策工具,推动可持续水资源管理的全球实施。

  

在全球水资源短缺日益严重的背景下,雨水收集(Rainwater Harvesting, RWH)系统作为一种可持续的水资源管理方式,正受到越来越多关注。然而,尽管RWH系统具有减少对集中式饮用水供应依赖、缓解城市径流和降低极端天气事件引发的洪水风险等多重优势,其全球推广仍面临重大障碍。主要问题在于业主和投资者对其经济可行性的普遍担忧。传统的经济评估方法往往无法充分考虑影响RWH系统的非线性和多变量因素,导致评估结果不够准确,从而限制了RWH系统的广泛应用。

为了解决这一问题,研究人员开展了一项创新性研究,旨在开发一个基于机器学习的框架,以预测分散式屋顶RWH系统的经济可行性。该研究收集了来自全球六大洲20多个国家、150多个城市的1841个RWH系统案例数据,涵盖了广泛的地理、气候、建筑和经济特征。通过应用四种机器学习算法——随机森林(Random Forest, RF)、AdaBoost、轻量梯度提升机(Light Gradient Boosting Machine, LGBM)和多层感知器(Multi-Layer Perceptron, MLP),研究人员对这些数据进行了深入分析。研究发现,RF模型在预测效益成本比(Benefit-Cost Ratio, BCR)方面表现最佳,其R2达到0.906,平均绝对误差(MAE)为0.096,均方根误差(RMSE)为0.209。相比之下,净现值(Net Present Value, NPV)和投资回收期(Payback Period, PBP)的预测精度稍低,但仍具有参考价值。

为了增强模型的可解释性,研究采用了SHapley Additive exPlanations(SHAP)方法,识别出影响BCR的关键因素包括水价(贡献度20.8%)和降雨变异系数(20.5%)。对于NPV预测,集水面积(43.3%)和总建筑面积(36.3%)是主导因素;而对于PBP,项目寿命(19.7%)是最重要的预测因子。此外,研究还开发了一个基于Streamlit的用户友好网络应用程序,使用户能够输入区域和建筑特定参数,快速评估RWH系统的经济可行性。

这项研究的主要技术方法包括数据收集与处理、特征与模型选择、模型训练与超参数优化以及模型评估与应用部署。数据来源包括规划设计文档、实地调查和公开文献,特别是通过Web of Science Core Collection(WoSCC)数据库检索相关研究。研究选取了12个输入变量,包括年降雨量、降雨变异系数、集水面积、总建筑面积、日用水需求、用户数量、建筑高度、水箱容积、项目寿命、水价、能源成本和贴现率,以及三个输出变量:BCR、NPV和PBP。通过5折交叉验证和贝叶斯优化算法,RF模型被确定为最优预测模型。

研究结果显示,RF模型在测试集上表现出色,BCR预测的R2为0.9062,RMSE为0.2093,MAE为0.096。尽管NPV和PBP的预测误差较大,但仍在可接受范围内,适用于规划阶段的评估。残差分析表明,BCR的残差主要集中在零附近,而NPV和PBP的残差分布较广,反映了这些指标对系统规模和经济可行性的敏感性。

通过SHAP分析,研究进一步揭示了各特征对预测结果的影响。水价和降雨变异系数对BCR的影响最为显著,而总建筑面积和集水面积对NPV的预测起主导作用。项目寿命则是影响PBP的最重要因素。特征依赖性分析还发现,水价与总建筑面积的交互作用对BCR预测具有重要影响,表明 larger building areas amplify the financial benefits gained from higher water prices。

研究的讨论部分强调了机器学习方法在处理高维和非线性数据方面的优势,相比传统方法如经验模型、随机参数方法和连续模拟方法,机器学习能够更准确地捕捉复杂模式,提高预测精度。此外,通过集成网络应用程序,研究大大提升了RWH经济评估工具的可及性和实用性,使非专业用户也能轻松进行可行性分析。

然而,研究也存在一些局限性。数据的地理和规模分布不连续可能影响预测精度,特别是在NPV和PBP指标上。未来研究可以通过纳入更多本地化数据和改进区域数据集来提高模型准确性。此外,模型基于历史数据训练,可能无法准确预测未来气候和政策变化下的RWH系统性能。因此,未来工作可能需要整合气候预测和政策模拟,以增强模型的鲁棒性和适应性。

总之,这项研究通过开发一个基于机器学习的全球适用框架,显著提高了RWH系统经济可行性评估的准确性和效率。研究的发现和工具不仅为工程师、业主和政策制定者提供了可靠的决策支持,也为推动可持续水资源管理的全球实践做出了重要贡献。论文发表在《Results in Engineering》,为相关领域的研究和应用提供了有价值的参考。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号