基于机器学习的无传感器农田实际作物系数估算模型研究

《Smart Agricultural Technology》:Machine Learning Models for Actual Crop Coefficient Estimation on Sensor-Less Fields

【字体: 时间:2026年01月04日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  本研究针对农业水资源管理中实际作物系数(Kc-act)精准估算的难题,提出了一种融合ERA5-L再分析数据与随机森林机器学习框架的创新方法。通过整合涡度协方差塔实测数据,该模型在柑橘园和橄榄园分别实现了0.073和0.143的RMSE精度,为不同气候带作物提供了无需田间传感器的灌溉优化方案,对提升农业水资源利用效率具有重要实践价值。

  
在全球淡水资源日益紧张的背景下,农业灌溉作为消耗全球70%淡水资源的领域,正面临着气候变化和人口增长的双重压力。传统作物系数估算方法严重依赖田间传感器网络,存在设备成本高、维护复杂且数据易缺失等问题。如何在不依赖昂贵传感器网络的条件下实现作物实际需水量的精准估算,成为智慧农业发展的关键瓶颈。
发表于《Smart Agricultural Technology》的这项研究,创新性地构建了融合机器学习与再分析数据的综合框架。研究团队通过整合ERA5-L再分析气候数据和涡度协方差塔实测的作物实际蒸散量(ETa)数据,建立了基于随机森林的机器学习模型,实现了在无传感器田间条件下对实际作物系数(Kc-act)的精准估算。该研究跨越三大洲的六个典型农田(意大利2个、美国3个、加拿大1个),涵盖柑橘、橄榄、小麦、玉米等不同作物类型,以及地中海气候、大陆性气候等多种气候带,确保了模型的普适性。
关键技术方法主要包括:利用ERA5-L再分析数据库获取温度、辐射、湿度等气象要素;通过涡度协方差塔直接测量实际蒸散量(ETa);采用随机森林算法构建ETa预测模型;运用季节性分解技术剔除时间序列噪声;通过交叉验证优化模型超参数。

2.1. 试验农田

研究选取的六个试验田具有显著的气候和作物差异。意大利的Villabate柑橘园(0.5公顷)和Castelvetrano橄榄园(6公顷)代表地中海气候区果树作物;美国的US-ARM小麦田(13公顷)、US-Ne1玉米田(50公顷)和US-CF1小麦田(40公顷)以及加拿大的CA-ER1玉米田(13公顷)则覆盖了湿润大陆性气候等多种农业生态系统。所有试验点均配备了涡度协方差通量塔,持续监测时间从3年到20年不等。

2.2. 微气象数据

意大利试验点的实际蒸散量(ETa)通过涡度协方差系统直接测量,美国和中国站点数据来自AmeriFlux网络。数据质量控制采用FLUXNET标准协议,包括能量平衡闭合检验(闭合比CR介于0.88-1.03之间),确保数据可靠性。剔除日降雨量超过2.5毫米的观测记录,以避免降水对湍流通量测量的干扰。

2.3. 再分析数据

研究使用ECMWF发布的ERA5-Land每日聚合数据集,空间分辨率0.1°×0.1°,包含最高/最低气温、太阳辐射、露点温度和风速等变量。通过Google Earth Engine平台高效获取和处理这些数据,验证表明再分析数据与气象站观测值具有良好一致性。

2.4. 随机森林机器学习模型

采用随机森林算法预测ETa,通过网格搜索优化超参数(决策树数量100-400棵,最大深度10-30,叶节点最小样本数1-4)。模型输入特征包括温度、辐射、湿度、风速和年积日等,采用k折交叉验证(k=3-6)评估性能。

2.5. 统计评估指标

使用均方根误差(RMSE)、标准化均方根误差(nRMSE)、平均偏差误差(MBE)和百分比偏差(PBIAS)等指标评估模型性能。定义改进度指标量化相较于传统方法的精度提升。

3.1. 预处理

采用迭代插补法处理缺失数据,Z-score标准化规范化特征,打乱时间序列顺序以减少过拟合。

3.2. 基于RF模型的ETa时间序列缺口填充

随机森林模型成功填补了各试验点ETa序列的缺失数据(缺失率10.9%-47.7%),决定系数R2介于0.62-0.83之间,RMSE范围为0.36-0.69 mm d-1

3.3. 后处理

通过ETa/ETo比值计算Kc-act,采用孤立森林算法识别并剔除异常值。

3.4. 季节性分解

使用加性模型将Kc-act时间序列分解为趋势项、季节项和残差项,去除高斯分布噪声后重构平滑序列。

3.5. 评估

将模型估算的Kc-act与FAO-56梯形模型及Rallo模型对比。特征重要性分析显示太阳辐射是最具预测力的特征(平均SHAP值最高),而最高气温在部分大陆性气候区呈现负相关。
研究结果显示,机器学习框架在不同作物和气候条件下均表现出优越性能。果树作物估算精度最高,柑橘园和橄榄园的RMSE分别达0.073和0.143;大田作物中,US-Ne1玉米田的预测精度最高(R2=0.82)。通过Kc-act与标准作物系数比值反演的水分胁迫系数(Ks)揭示出有趣的规律:地中海气候区果树在中生长季水分胁迫较轻(Ks=0.65-1.00),而大陆性气候区谷物作物在生长初期和末期水分胁迫显著(Ks=0.27-0.43)。季节性分解残差分析证实噪声符合高斯分布,验证了方法可靠性。
该研究的创新价值在于首次构建了不依赖田间传感器网络的实际作物系数估算体系,通过再分析数据与机器学习算法的有机结合,为水资源精准管理提供了可行路径。研究表明,即使在没有现场监测设备的条件下,仅凭公共气候数据和短期基准观测即可建立可靠的灌溉决策支持系统。这一成果对促进节水农业技术在全球范围内的推广,特别是在监测设施匮乏地区的应用具有重要实践意义,直接支撑联合国可持续发展目标中零饥饿、气候行动和陆地生物保护等多项议题。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号