机器学习算法在土壤水分时空外推预测中的应用与性能评估

【字体: 时间:2025年05月29日 来源:CATENA 5.4

编辑推荐:

  本研究针对土壤水分(SM)预测中时空外推的挑战,创新性地构建了支持向量回归(SVR)、随机森林(RF)和投票回归(VR)的机器学习框架。通过希腊Arta平原8个农业气象站的多层土壤水分数据(10/30/50 cm),验证了算法在校准站点未来数据(时间外推)和未监测站点(地理外推)的预测能力。结果表明,时间外推中R2>0.75且RMSE<0.042 cm3cm?3,地理外推显示预训练模型可有效预测异质区域的土壤水分。该研究为无监测站点提供新预测范式,对精准农业和水资源管理具有重要意义。

  

土壤水分动态监测是水文循环研究和农业灌溉管理的核心课题,但传统物理模型受限于土壤异质性和参数获取难度。当前机器学习(ML)在土壤水分预测中多聚焦时间序列分析或空间插值,对模型在未监测区域的泛化能力(地理外推)研究不足。尤其在地形复杂的农业流域,土壤质地、植被覆盖和微气候的局部差异会导致土壤水分空间变异显著,这对跨区域预测提出严峻挑战。

为解决这一科学难题,国内研究团队在希腊Arta平原325 km2的农业区展开创新研究。该平原以柑橘和猕猴桃种植为主,8个农业气象站构成监测网络(密度41 km2/站),持续采集10/30/50 cm深度的土壤水分数据及气象参数。研究首次系统评估了支持向量回归(SVR)、随机森林(RF)和投票回归(VR)三种算法在时空外推中的表现:先利用各站3年数据校准模型,再用1年未来数据验证时间外推性能;继而将某站预训练模型直接应用于其他站点,测试地理外推能力。

关键技术方法包括:1) 基于互信息(NMI)和排列重要性筛选特征变量(降水、土壤温度、GPP等);2) 高斯核SVR的超参数(C/γ/ε)优化;3) RF的基树数量(n_estimators)与节点分裂准则(max_features)调参;4) 10折交叉验证防止过拟合;5) 通过RMSE和R2评估模型性能。

3.1. 预测变量重要性
特征分析揭示降水是影响所有深度的首要因子(NMI>0.6),尤其在砂壤土站点(eP1/eP2)主导模型表现。而黏土站点(S08/S06)中GPP(总初级生产力)贡献显著,反映生物活动通过改变土壤孔隙结构间接调控水分运移。温度类变量与土壤水分呈强负相关,但线性相关系数低估了非线性相互作用。

3.2. 算法优化
SVR通过低正则化参数(C=0.1-4)避免过拟合,RF则在max_features=3-6时误差指数下降。值得注意的是,节点最小样本数(min_samples_leaf)减小可提升RF精度,这与决策树细分增加同质性有关。

3.3. 时间外推性能
所有模型在预测未来1年数据时均表现良好,SVR在30 cm深度表现最优(RMSE=0.015 cm3cm?3)。深层土壤(50 cm)预测误差最低(5×10-5 cm3cm?3),印证水分动态随深度趋于稳定。极端值预测偏差主要出现在土壤水分波动剧烈的东北边界站点(eP系列),这与当地砂质土快速入渗特性相关。

3.4. 地理外推验证
预训练模型在异质站点间迁移时,S20站校准模型在S08站30 cm深度取得最佳外推效果(RMSE=0.0115)。尽管精度略低于时间外推,但整体误差范围证明ML框架可捕捉流域尺度空间变异规律。黏土区域(S08)因水分值域广(近饱和至萎蔫点),预测挑战最大。

这项发表在《CATENA》的研究突破性地证实:1) 仅需常规气象数据和单站校准,ML模型即可实现跨区域土壤水分预测;2) SVR在中等深度(30 cm)超越复杂集成算法;3) 地理外推性能与土壤质地密切相关,砂壤土区需重点优化降水特征权重。该成果为"无测站流域预测"(PUB)提供实用解决方案,尤其适用于监测网络稀疏的农业区。未来研究可结合卫星土壤水分产品(SMAP)和深度学习方法,进一步提升全球尺度应用的鲁棒性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号