基于深度学习的蒸散发估算模型在传感器性能不稳定条件下的鲁棒性研究

【字体: 时间:2025年08月09日 来源:Franklin Open CS1.4

编辑推荐:

  为解决半干旱地区精准灌溉中参考蒸散发(ET0)估算的实时性与鲁棒性问题,研究人员比较了CatBoost、LightGBM、LSTM等五种模型在数据缺失场景下的表现。结果表明Bi-LSTM在完整数据下达到最高测试R2=0.9651,而CatBoost在1.86%数据缺失时仍保持R2≥0.875,其亚毫秒级推理速度(0.0032秒/200样本)特别适合边缘计算场景,为资源受限的农业物联网提供了可靠解决方案。

  

在全球气候变化加剧和水资源短缺的背景下,精准灌溉已成为农业可持续发展的关键。然而,传统蒸散发(ET0)估算方法如FAO-56 Penman-Monteith需要完整气象数据,而农村地区的物联网(IoT)设备常因传感器故障、电力中断等问题导致数据缺失,严重影响灌溉决策的准确性。针对这一挑战,摩洛哥西迪·穆罕默德·本·阿卜杜拉大学(Université Sidi Mohamed Ben Abdellah)工程建模与系统分析实验室(LIMAS)的研究团队开展了一项创新研究,通过对比五种机器学习模型在数据缺失场景下的表现,为资源受限的农业环境提供了可靠的解决方案。该研究成果发表在《Franklin Open》期刊上。

研究人员采用TimeSeriesSplit交叉验证方法保持时间序列完整性,注入1.86%合成缺失数据模拟真实故障场景,通过网格搜索优化CatBoost和LightGBM的超参数,使用Keras构建LSTM系列模型并设置mask_value=-1处理缺失值,最后采用R2、RMSE和RPD指标评估模型性能。

在"ET0计算与机器学习估算"部分,研究基于FAO-56 Penman-Monteith方程计算基准值,发现Bi-LSTM在完整数据下表现最优(测试R2=0.9651,RMSE=0.0623 mm/天),而CatBoost(1000次迭代,学习率0.05,深度6)在保持亚毫秒级推理速度(0.0032秒/200样本)的同时达到R2=0.9614。

"深度学习模型比较"章节详细对比了模型复杂度:CatBoost仅需0.064M参数和7.49MFLOPs,远低于LSTM(120单元)的0.29M参数和Bi-LSTM(120单元)的0.81M参数。图4显示CatBoost预测点最紧密分布在理想对角线附近,表明其优异的预测一致性。

"数据缺失场景下的ET0估算"是研究的核心创新。表7显示CatBoost在20种缺失场景中保持稳定,即使缺少风速数据时(图5),模型通过提升相对湿度和辐射特征的权重实现补偿;而在缺少18:00-24:00数据的场景(图6),日间辐射特征成为主导预测因子,使测试R2仍达0.9441。

这项研究证实CatBoost在参数效率(0.064M)和计算开销(128KFLOPs)方面具有显著优势,其有序提升(Ordered Boosting)和对称树生长(Symmetric Tree Growth)机制有效防止了过拟合。相比需要GPU支持的深度学习方法,CatBoost的CPU友好特性使其更适合边缘计算部署。研究首次系统结合了特征缺失和时间缺失模拟,采用时间序列交叉验证防止数据泄漏,为干旱地区智能灌溉系统提供了经得起实践检验的算法框架。未来可通过集成卫星遥感数据和动态作物系数(ETc)进一步扩展应用场景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号