基于可解释高维特征投票集成框架的加拿大海洋省份马铃薯块茎产量预测研究

【字体: 时间:2025年08月15日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  为解决马铃薯产量预测中土壤参数复杂性和模型可解释性不足的问题,研究人员开发了基于Boruta-SHAP特征选择和VOTE-LGCB集成学习的预测框架。该研究通过多准则决策方法(WASPAS/MOORA)筛选关键土壤特征(如MC2、NDVI4),模型测试集准确率达R=0.8958,RMSE=5088.51,为精准农业决策提供了可靠工具。

  

在全球粮食安全面临挑战的背景下,马铃薯作为全球第五大粮食作物,其产量稳定性直接关系到农业经济与食品供应链。然而,传统产量预测方法依赖经验判断和单一环境参数,难以捕捉土壤-作物系统的复杂相互作用。尤其在加拿大海洋省份(如爱德华王子岛和新不伦瑞克),马铃薯贡献了全国38%的产量,但土壤参数的空间异质性和气候波动使精准预测成为难题。

加拿大爱德华王子岛大学(University of Prince Edward Island)气候变化与适应研究中心的研究团队通过四年田间试验,采集30项土壤理化指标(包括电导率HCP/PRP、含水量MC、NDVI等),创新性地提出VOTE-LGCB框架——融合投票式CatBoost与LightGBM的超级集成模型,结合Boruta-SHAP特征筛选和MCDM优化,实现了块茎产量的高精度预测。该成果发表于《Computers and Electronics in Agriculture》,为农业决策系统提供了兼具准确性与可解释性的新范式。

研究采用三大关键技术:1)Boruta-SHAP筛选17项核心特征(如MC3、NDVI4);2)最佳子集回归(BSR)结合WASPAS/MOORA确定四组最优特征组合;3)构建VOTE-LGCB集成模型,通过SHAP工具解析特征贡献度。

研究结果显示:

  1. 1.

    特征筛选:MC2(含水量)被识别为最具影响力因子,SHAP值达17.81,其次为NDVI4和PAl1(磷铝比)。

  2. 2.

    模型性能:VOTE-LGCB在测试集表现最优(R=0.8958,可靠性93.75%),较传统LASSO模型误差降低8.3%。

  3. 3.

    决策优化:Combo 3(含13项特征)经MOORA验证为最佳输入组合(WASPAS=3.23E-06)。

讨论部分强调,该框架首次实现土壤高维特征与可解释AI的协同应用,揭示含水量与植被指数对产量的非线性影响规律。实际应用中,农民可通过监测MC2和NDVI动态调整灌溉,预计可提升边际土地产量12-15%。研究还指出,未来需整合气象数据和病虫害参数以增强模型泛化能力,但其现有成果已为智慧农业提供了可推广的技术模板。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号