
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的气候变量与水稻产量预测模型构建及在孟加拉国的应用研究
【字体: 大 中 小 】 时间:2025年07月26日 来源:Next Research
编辑推荐:
本研究针对气候变化背景下孟加拉国水稻产量预测需求,整合34个气象站数据与三大稻种区域产量数据,系统评估MLR与多种机器学习模型性能。研究发现XGBoost回归模型表现最优(R2=0.908,RMSE=0.235),预测2029-30年度产量达3.20 M.ton/ha,为农业决策提供精准工具。
在全球气候变化加剧的背景下,孟加拉国作为全球最大的水稻生产国之一,正面临着严峻的农业生产挑战。这个南亚国家独特的地理位置使其气候系统复杂多变——炎热的夏季、暴雨倾盆的季风季、凉爽的冬季以及过渡性春季交织成独特的农业生产环境。然而,近年来气温的持续升高、年降雨量的减少以及干旱天数的增加,正在深刻改变着这个"千河之国"的农业生态。水稻作为孟加拉国的"生命线",占据全国75%的耕地面积,提供75%的卡路里摄入和55%的蛋白质来源,其产量波动直接关系着1.7亿人口的粮食安全。
传统的水稻产量预测方法如多元线性回归(MLR)虽然简单易用,但难以捕捉气候变量与产量之间复杂的非线性关系。更令人担忧的是,随着气候变化加剧,历史数据建立的线性模型预测准确性正在下降。正是在这样的背景下,研究人员开展了一项开创性研究,旨在开发更精准的产量预测模型。
这项发表在《Next Research》的研究采用了创新的机器学习方法。研究团队收集了2012-13至2022-23财年孟加拉国34个气象站的完整气象数据,包括最高/最低温度、降雨量、湿度、风速和日照时长等关键指标。同时整合了全国三大水稻品种(Aus、Aman和Boro)的区县级产量数据。通过10折交叉验证方法,系统比较了MLR与随机森林(RF)、XGBoost等多种机器学习算法的预测性能。
研究方法上,研究团队首先进行了详尽的数据预处理,将气象站数据按行政区划聚合,并与水稻产量数据进行匹配。通过相关性分析发现,最高温度与最低温度存在强相关性(r=0.78),而日照时长与产量呈显著正相关。为克服传统MLR的局限性,研究采用了能够捕捉非线性关系的机器学习算法,并使用R2和均方根误差(RMSE)等指标评估模型性能。
研究结果部分,《统计模型》显示传统MLR虽然简单,但违反了随机误差和线性假设;《相关性分析》揭示了气候变量间的复杂相互作用;《结论》部分明确指出,在六种测试的机器学习模型中,XGBoost回归表现最为突出,其R2值高达0.908,RMSE低至0.235。相比之下,RF模型虽然R2略高(0.909),但在其他指标上稍逊一筹。基于这些模型,研究人员预测2029-30财年孟加拉国水稻产量将达到3.20吨/公顷。
这项研究的科学意义重大。首先,它证实了机器学习在农业产量预测中的优越性,特别是处理气候变量与作物产量间的复杂非线性关系。其次,研究提出的XGBoost模型为政策制定者提供了可靠工具,可以更准确地预判气候变化对粮食生产的影响。正如作者Sanjoy Kumar Roy和Mohammad Ahsan Uddin在《CRediT authorship contribution statement》中强调的,这项研究为应对气候变化下的粮食安全挑战提供了科学依据。从长远看,这种精准预测能力将帮助孟加拉国实现"将水稻产量从2015年的35.29百万吨提升至2050年的60.85百万吨"的可持续发展目标,为全球水稻主产区应对气候变化提供了可借鉴的解决方案。
生物通微信公众号
知名企业招聘