
-
生物通官微
陪你抓住生命科技
跳动的脉搏
知识引导的机器学习(KIML)方法解析混合种植系统中单双季稻产量及可达到产量差距
【字体: 大 中 小 】 时间:2025年06月10日 来源:Computers and Electronics in Agriculture 7.7
编辑推荐:
针对混合种植区单双季稻产量难以分离导致产量差距评估不准的问题,研究人员提出知识引导机器学习(KIML)方法,通过融合卫星遥感种植强度特征与XGBoost模型,成功将单双季稻产量分离精度提升至r=0.88-0.91,偏差降低至-2.6%-1.4%,为精准农业政策制定提供新工具。
在全球气候变化和人口持续增长的双重压力下,如何通过有限耕地提升粮食产量成为重大挑战。水稻作为全球半数人口的主粮,其产量差距的精准评估对农业管理至关重要。然而,在单双季稻混作区,由于种植结构复杂、生长条件多样,传统方法难以区分两类水稻的产量贡献,导致现有评估存在34%-40%的高估偏差。这一瓶颈严重制约了精准农业政策的制定。
针对这一难题,中国研究人员创新性地提出知识引导机器学习(KIML)方法。该方法突破性地将卫星反演的种植强度知识作为特征输入和约束性损失函数,融入极端梯度提升(XGBoost)模型框架。研究选取中国南方典型混作区(湖北、湖南、江西、广东)进行验证,这些区域贡献了全国41.4%的水稻种植面积和36.4%的产量。
关键技术包括:1)利用MODIS卫星数据提取NDVI/NDWI等植被指数作为时序特征;2)构建包含气候、土壤、地形等28个静态特征的数据库;3)采用皮尔逊相关系数筛选关键变量;4)设计融合种植强度约束的XGBoost损失函数。通过对比纯机器学习模型,KIML展现出显著优势。
【研究结果】
特征重要性分析
卫星衍生的NDVI和NDWI植被指数与产量相关性最高(r>0.5),而种植强度特征在区分单双季稻时具有决定性作用。
模型性能验证
KIML的预测精度(r=0.88-0.91)显著优于纯ML模型,相对均方根误差(RRMSE)降低至9.1%-10.3%。单季稻产量偏差从-9.2%改善至-2.6%,双季稻从3.7%降至1.4%。
产量差距评估
与联合国粮农组织全球农业生态区(GAEZ)数据对比显示,KIML估算结果相关性(r=0.65)远高于纯ML(r=0.37)。中国南方水稻增产潜力达17.1%,产量缺口为1235万吨,其中单双季稻分别贡献46.2%和53.8%。
传统方法偏差量化
传统聚合评估方法会高估产量缺口34.1%,生产缺口40.0%,证实区分水稻类型的必要性。
【结论与意义】
该研究创建的KIML框架首次实现混作系统单双季稻产量的精准解耦,其创新性体现在:1)将先验知识转化为可量化的模型约束;2)建立多源数据融合的标准化流程;3)揭示混作区产量缺口的真实构成。研究成果为《Computers and Electronics in Agriculture》提供了农业大数据分析的新范式,对全球主要稻作区的精准管理具有普适指导价值。特别是提出的"知识引导+数据驱动"双引擎策略,为复杂农业系统的建模开辟了新途径。
生物通微信公众号
知名企业招聘