利用多源遥感和机器学习技术对伊朗雨养小麦的收获前产量进行预测
《Agricultural Water Management》:Pre-harvest forecasting of rainfed wheat yield in Iran using multi-source remote sensing and machine learning
【字体:
大
中
小
】
时间:2025年11月22日
来源:Agricultural Water Management 6.5
编辑推荐:
多源遥感与气象数据融合的机器学习模型在伊朗雨养小麦产量预测中的应用研究,比较了随机森林、XGBoost和支持向量回归三种算法的预测性能,发现XGBoost模型表现最优(R2=0.64,NRMSE=42%,MAE=0.25 t/ha),关键预测因子包括NDVI(4月、11月、12月)、降水量(2-3月)、地表温度(4月、12月)和土壤 moisture(0-10 cm深度,10-12月)。
### 雨养小麦产量预测的机器学习方法研究
在全球气候变化和农业产量波动日益加剧的背景下,准确预测干旱和半干旱地区如伊朗的雨养小麦产量对于保障粮食安全具有重要意义。本研究利用多源遥感和气象数据,开发并比较了三种机器学习(ML)算法:随机森林(Random Forest)、XGBoost 和支持向量回归(Support Vector Regression),以预测伊朗22个省份在2001年至2021年间的雨养小麦产量。研究结果显示,XGBoost 在80%训练数据下表现最佳,其 R2 值达到0.64,归一化均方根误差(NRMSE)为42%,平均绝对误差(MAE)为0.25吨/公顷,优于其他两种算法。此外,研究还发现,预测时间在收获前两个月(即4月)时,模型预测效果最佳,关键预测因子包括 NDVI(4月、11月、12月)、降水(2月、3月)、地表温度(LST)(4月、12月)和叶面积指数(LAI)(4月)。
### 研究背景与意义
随着全球人口的持续增长,对粮食产品的需求也在不断上升,而气候变化对农业生产力的影响愈发显著。准确的作物产量预测不仅有助于制定国家粮食供应政策,还支持联合国可持续发展目标(SDG 2)的实现,并为农业管理和稳定提供科学依据。特别是在干旱和半干旱地区,农业产量极易受到干旱的影响,因此需要更精确的预测手段。传统的预测方法,如实地调查、生物物理模拟和统计模型,存在成本高、数据稀缺和精度不足等问题。近年来,机器学习和遥感技术的快速发展为农业产量预测提供了新的思路,这些方法能够更高效地处理复杂的数据关系,并在大规模预测中表现出更高的准确性和适用性。
### 研究方法与数据来源
本研究选取了伊朗22个主要雨养小麦产区,涵盖了多种气候条件下的农业区域。数据采集时间跨度为2001年至2021年,期间收集了小麦产量(以吨/公顷为单位)和相关环境变量,如植被指数、地表温度、降水、土壤湿度等。遥感数据主要来自 MODIS 传感器,包括归一化植被指数(NDVI)、叶面积指数(LAI)、地表温度(LST)、光合有效辐射分数(FPAR)和蒸散发(ET)。气象数据则来自 ERA5 和 TerraClimate 数据集,其中包含了降水、温度和 Palmer 干旱严重度指数(PDSI)。此外,FLDAS 数据集提供了0–10厘米和10–40厘米深度的土壤湿度信息。通过这些多源数据的融合,研究旨在建立一个更加全面和准确的产量预测模型。
### 机器学习算法的选择与优化
为了提高预测的准确性,本研究采用了三种主流的机器学习算法:随机森林(RF)、XGBoost 和支持向量回归(SVR)。这些算法各有其优势和特点。随机森林作为一种集成学习方法,能够处理非线性关系,并具有良好的泛化能力。XGBoost 则是一种基于梯度提升的算法,通过优化计算效率和减少过拟合,提高了模型的鲁棒性。支持向量回归(SVR)则以其在高维空间中的表现而著称,能够有效捕捉复杂的非线性关系。为了确保模型的准确性,研究对这些算法的超参数进行了优化,包括最大树深度、学习率、树的数量、特征采样比例等。通过网格搜索和随机搜索方法,研究确定了最佳的参数组合,并进行了交叉验证以提高模型的稳定性。
### 模型评估与结果分析
模型的评估采用了标准的统计指标,包括决定系数(R2)、归一化均方根误差(NRMSE)和平均绝对误差(MAE)。研究发现,当训练数据比例为80%时,模型的预测效果最佳。XGBoost 在这一条件下达到了最高的 R2 值(0.64),而随机森林和支持向量回归的 R2 值分别为0.60和0.55。进一步分析发现,预测时间越接近收获期,模型的预测精度越高。例如,在收获前两个月(即4月)进行预测,其 R2 值相较于收获前四个月(即2月)提高了约3%。这表明,在作物生长的后期,遥感数据和气象变量的关联性更强,能够更准确地反映作物的最终产量。
### 关键预测因子分析
研究还对影响小麦产量的关键预测因子进行了分析。结果表明,NDVI 和 LAI 是最重要的两个植被指数,它们在4月、11月和12月的预测中表现出较强的关联性。此外,降水和土壤湿度也对产量有显著影响,特别是在2月、3月和10月等关键生长阶段。地表温度(LST)在4月和12月对产量的预测具有重要作用,而空气温度则在12月和4月对XGBoost和RF算法的预测效果产生了显著影响。这些发现强调了不同生长阶段对产量的影响,以及遥感数据在农业监测中的价值。
### 模型的局限性与未来展望
尽管本研究在雨养小麦产量预测方面取得了良好的效果,但仍存在一些局限性。首先,遥感数据的空间分辨率可能限制了模型对田间微小变化的捕捉能力,从而引入了一定的不确定性。其次,数据缺失问题虽然通过插值和时间聚合得到了缓解,但仍需进一步改进数据质量和传感器技术以提高模型的适用性。此外,研究发现,模型在预测高产和低产时存在一定的偏差,这可能是由于目标值分布不均导致的回归到均值现象。为了减少这种偏差,未来可以考虑采用分层抽样、分布感知重采样或非对称损失函数等方法,以增强模型对极端产量的预测能力。
### 实际应用与政策建议
本研究的结果为伊朗的农业规划和水资源管理提供了重要的参考。通过结合遥感数据和机器学习算法,可以实现对雨养小麦产量的更准确预测,从而支持精准农业和补充灌溉计划的制定。研究还表明,预测时间越接近收获期,模型的预测精度越高,这对于农民的种植决策和农业管理具有重要意义。此外,研究结果也强调了气象变量和植被指数在作物生长过程中的关键作用,特别是降水和土壤湿度对早期生长阶段的影响,以及NDVI和LAI对后期产量的决定性作用。
### 研究贡献与展望
本研究首次在伊朗范围内系统评估了多种机器学习算法在雨养小麦产量预测中的应用效果,填补了该领域的研究空白。通过引入多源遥感和气象数据,研究构建了一个更加全面和准确的预测模型。同时,研究还揭示了不同生长阶段对产量的影响,为未来的农业预测提供了新的视角。尽管当前研究已经取得了一定的成果,但仍需进一步探索更高级的深度学习模型,以提高预测的精度和泛化能力。此外,研究结果的应用应考虑不同气候条件和数据可用性的地区差异,以增强模型的适应性和实用性。
### 研究团队与资助信息
本研究由伊朗德黑兰大学农业与自然资源学院的农业工程系完成,研究团队包括 Hanie Bourbour、Mohammad Abdolahipour、Hojjat Abdollahi、Ershad Abiar 和 Mahmoud Mashal。他们共同参与了研究的设计、数据收集、模型构建和结果分析。本研究未获得任何特定的资助,而是基于团队的研究经费和资源进行。研究结果为农业管理提供了科学支持,同时也为未来的农业预测研究奠定了基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号