零膨胀与偏态河流流量混合建模框架:提升热带雨养流域极端径流预测能力

【字体: 时间:2025年10月12日 来源:Journal of Hydrology 6.3

编辑推荐:

  本文提出一种融合零膨胀模型(ZIM)、长短期记忆网络(LSTM)与轻量梯度提升机(LightGBM)的混合机器学习框架,有效解决热带地区日尺度径流数据零值泛滥与右偏分布难题。该模型在R2=0.95、NSE=0.95等指标上显著优于传统模型,为极端水文事件预警与水资源管理提供创新性解决方案。

  
Materials and methods
本研究提出混合机器学习框架以解决径流分布中零值泛滥和高度右偏的双重挑战。通过零膨胀模型(ZIM)识别和量化径流事件,流程涵盖基于稳健ML与DL技术的分类与回归分析。为增强预测鲁棒性和模型多样性,额外引入基于提升集成算法的学习器。数据预处理与模型架构根据水文数据特性专项设计。
Exploratory data analysis
为全面理解建模挑战,对目标变量与预测变量进行深度解析(详见表2)。目标径流数据集呈现高度右偏分布(偏度系数=5.10,峰度=43.06)。平均值(60.15 m3/s)显著高于中位数(48.85 m3/s),标准差接近均值的两倍,变异系数达176%,凸显数据极度离散特性。
Discussions
当前ML/DL与集成模型在径流建模中的应用虽获认可,但较少研究针对数据集固有统计特性提出流域特异性解决方案。采用适配策略将显著提升模型对零膨胀与极端右偏径流的预测能力。尽管先进ML/DL回归模型能捕捉复杂非线性关系,但其对极端偏态和零值密集分布的适应性仍存在本质局限。
Summary and conclusions
本研究开发的机器学习建模框架成功解决了目标数据集中的零值泛滥和重度右偏问题。该框架特别适用于以降雨为唯一径流驱动力的热带河流系统日尺度径流预测,能有效捕捉此类环境中径流的显著变异性和间歇性特征。
CRediT authorship contribution statement
Divya Chandran: 概念化、数据管理、形式分析、调研、方法论、软件、可视化、原稿撰写。
N.R. Chithra: 概念化、数据管理、形式分析、调研、方法论、项目管理、监督、验证、可视化、文稿审阅。
Funding
作者声明在文稿准备过程中未获得任何资金、资助或其他支持。
Declaration of competing interest
作者声明不存在可能影响本研究结果的已知竞争性经济利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号