
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的农田小麦籽粒蛋白质含量与产量协同预测模型研究
【字体: 大 中 小 】 时间:2025年08月13日 来源:Precision Agriculture 6.6
编辑推荐:
本研究针对农田小麦籽粒蛋白质含量(GPC)空间变异性大、传感器普及率低导致的精准管理难题,采用随机森林(Random Forest)算法整合产量数据、农艺参数与公开地理信息数据,构建了澳大利亚新南威尔士州和西澳大利亚州63块田地的GPC与产量预测模型。通过双折交叉验证(2FCV)和留一田块-年份交叉验证(LOFYOCV)证实,融合多源数据的模型能有效填补未采样区域数据(LCCC>0.8),为优化氮肥管理、提升农场经济效益和环境可持续性提供决策支持。
在全球粮食安全与农业可持续发展背景下,小麦籽粒蛋白质含量(GPC)作为决定粮食价格和营养品质的关键指标,其田间空间变异性长期困扰着农业生产者。尽管精准农业技术快速发展,但蛋白质传感器的应用滞后导致农田GPC数据严重缺失,农民难以实施差异化的氮肥管理。这种数据缺口不仅影响农场经济效益——澳大利亚小麦按蛋白质含量分级定价的差价可达每吨100澳元,更阻碍了氮肥使用效率(NUE)的精准评估,可能造成资源浪费和环境污染。
针对这一难题,西澳大利亚大学1的Mikaela J. Tilse团队联合国际研究人员,在《Precision Agriculture》发表了突破性研究。该团队创新性地将机器学习与多源空间数据融合,收集澳大利亚两大主产区4个生长季(2020-2023)的63组配对产量-GPC地图,构建了首个能同时预测小麦产量和GPC的空间模型。研究巧妙利用农场既有数据(播种/收获日期、品种、轮作历史)和公开地理数据集(数字高程模型DEM、哨兵2号植被指数、伽马辐射数据),通过随机森林算法量化各因素对GPC的影响权重,并开发了适用于不同应用场景的两种验证方法。
关键技术方法包括:1) 使用约翰迪尔HarvestLab 3000?近红外传感器获取高分辨率(1-3秒/点)田间GPC和产量数据;2) 通过dataharvester R包整合多源空间数据(30米分辨率);3) 采用置换重要性检验的迭代变量选择法优化模型;4) 设计LOFYOCV(外推验证)和2FCV(内插验证)双验证体系;5) 在30米网格和管理分区两种尺度评估模型性能。
模型性能比较
实验1(产量+农艺+公开数据)展现出最佳预测能力,其中西澳农场GPC预测的LCCC达0.85。值得注意的是,2FCV验证(模拟单台蛋白质传感器作业)显著优于LOFYOCV(R2提升0.12-0.15),证实模型能有效填补同一田块内的数据空白。
关键驱动因素
变量重要性分析揭示:1) 西澳地区伽马辐射数据(铀、钍、钾)对GPC预测贡献度达27%,反映土壤母质对蛋白质形成的长期影响;2) NDRE(归一化红边差异指数)与GPC呈负相关(r=-0.37),印证水肥胁迫后期会推高蛋白质含量;3) 历史轮作数据对GPC的解释力比产量高40%,凸显前茬作物对氮素循环的持续效应。
管理实践价值
将预测结果聚合至3-5个管理分区后,模型对澳大利亚GPC分级(如11.5-13%溢价区间)的预测准确率(κ=0.81)达到"几乎完美"水平(Cohen标准)。研究证实,结合产量地图的GPC预测可实现:1) 田块级氮素收支核算;2) 边际效益空间制图;3) 选择性收获方案优化,为每公顷创造最高达230澳元的附加价值。
这项研究的创新性在于突破了蛋白质传感器普及率低的技术瓶颈,首次证明通过整合农场常规数据和公开地理信息,能实现接近实时监测精度的GPC预测。其建立的"数据融合-机器学习-双尺度验证"框架,不仅适用于小麦,还可扩展至大麦、油菜等作物。随着哨兵卫星星座和数字农业平台的发展,该成果为全球农田蛋白质含量动态监测提供了可推广的技术路径,对实现联合国可持续发展目标(SDGs)中的"零饥饿"和"负责任的消费生产"具有重要实践意义。未来研究可进一步探索:1) 基于气象数据的GPC提前预测;2) 利用可解释机器学习解析蛋白质形成的驱动机制;3) 经济模型与空间预测的耦合优化。
生物通微信公众号
知名企业招聘