基于多源胁迫数据集融合与跨生育期集成学习的冬小麦水氮复合胁迫早期产量预测方法

《Agricultural Water Management》:Interpretable across-period ensemble learning with multi-stress dataset fusion to enhance early-stage yield prediction under combined water and nitrogen stress using hyperspectral sensing

【字体: 时间:2026年02月04日 来源:Agricultural Water Management 6.5

编辑推荐:

  本研究针对复合胁迫下作物产量早期预测精度不足及模型泛化误差大的问题,通过融合多胁迫源数据集构建训练集,并开发跨生育期集成学习(APEL)框架,结合无人机高光谱遥感技术,实现了冬小麦抽穗期产量的高精度预测。结果表明,APEL-PLSR模型在两地抽穗期预测中R2分别达到0.72和0.647,较基准模型显著提升,为复杂胁迫环境下作物早期产量预测提供了创新解决方案。

  
在精准农业快速发展的今天,作物产量预测已成为田间管理和育种决策的重要支撑。传统作物生长模型需要复杂多源的参数输入,而统计模型又依赖费时费力的破坏性取样。随着人工智能技术的进步,结合遥感数据的机器学习模型为作物产量预测提供了更高效便捷的途径。然而,现有模型在应对复合胁迫(如水分和氮素同时缺乏)时普遍存在泛化能力不足的问题,且预测精度随着作物生育期推进而提高的特点,限制了其在需要早期决策的场景中的应用。
这项发表在《Agricultural Water Management》上的研究,针对冬小麦在水氮复合胁迫下的早期产量预测难题,提出了一套创新的解决方案。研究团队通过两年的田间试验,在河南新乡和河北邢台两个试验基地开展了系统的水氮梯度处理试验,利用无人机搭载的高光谱传感器获取作物冠层反射率数据,构建了多胁迫源数据集融合策略和跨生育期集成学习框架。
研究采用的主要技术方法包括:基于无人机的高光谱数据采集与预处理技术,采用Resonon PikaL高光谱成像仪获取400-1000nm范围内的冠层反射率数据;多胁迫源数据集构建方法,整合单一水分胁迫和氮素胁迫条件下的训练样本;跨生育期集成学习(Across-Period Ensemble Learning, APEL)框架,通过整合抽穗期和灌浆期数据提升早期预测精度;以及偏最小二乘回归(Partial Least Squares Regression, PLSR)、随机森林回归(Random Forest Regression, RFR)和轻量梯度提升机(Light Gradient Boosting Machine, LGBM)等多种机器学习算法的比较验证。
3.1. 复合胁迫处理下小麦产量的统计分析
通过两年度的田间试验,研究人员系统量化了水氮复合胁迫对冬小麦产量的影响。在2023年的试验中,设置6个水分梯度(W1-W6)和6个氮素梯度(N1-N6)处理,结果显示随着胁迫强度增加,小麦产量显著下降。2024年在此基础上选择了4个水分和4个氮素梯度进行复合胁迫处理,发现复合胁迫导致的产量损失大于单一胁迫的叠加效应,如在邢台试验点,W6N6处理比W1N1减产37.6%,超过了单一胁迫减产率之和的80%。
3.2. 不同数据集组成面对水氮复合胁迫的训练效果
研究首次量化了模型在复合胁迫条件下的性能衰减情况。使用2023年单一胁迫数据训练的模型预测2024年复合胁迫产量时,RFR、LGBM和PLSR模型的R2平均下降13.6%。多胁迫源数据集融合策略显著提升了模型性能,与最佳单一胁迫数据集相比,平均R2提高8.51%,其中PLSR模型表现最优。
3.3. 抽穗期产量预测建模方法的性能比较
APEL-PLSR框架在两个试验点的抽穗期预测中均表现最佳,在新乡和邢台分别达到R2为0.72和0.647,RMSE为0.669 t/ha和1.304 t/ha,较基础PLSR模型RMSE降低78.2%和44.4%。与传统方法相比,APEL-PLSR实现了早期预测精度和时效性的最佳平衡。
3.4. APEL-PLSR框架的可解释性分析
通过消融实验发现,APEL框架中的多随机采样组件主要贡献R2提升,而多时期数据集成组件主要负责降低RMSE。结合VIP和SHAP值的特征重要性分析表明,红色和近红外波段对产量预测贡献最大,这与传统植被指数(如NDVI)的理论基础一致。不同胁迫条件下样本的SHAP值分布呈现规律性变化,为模型决策机制提供了直观解释。
4.1. 气象因子分析
两地气象条件的差异解释了模型性能的区域性变异。邢台试验点2024年生长季降水量较2023年下降57.66%,远高于新乡的25.18%,这种气候差异导致模型在邢台的预测性能相对较低,但反而验证了APEL框架在不同生态环境下的稳健性。
4.2. 多胁迫数据集融合的优势与区域差异
多胁迫源数据集融合策略通过整合N种单一胁迫的训练样本,有效应对2^N种可能的复合胁迫场景,在保证性能的同时大幅降低了数据收集成本。尽管与完全匹配的训练集相比存在数据差异,但该策略在两个试验点均显著提升了模型表现。
4.3. APEL框架的性能机制与挑战
APEL框架的创新性在于利用历史灌浆期数据增强当前抽穗期预测,突破了传统多时期方法需要同期多时期数据的限制。消融实验表明,PLSR处理高维数据的能力是基础精度保障,而多组件协同实现了精度和稳健性的双重提升。
4.4. 基于SHAP和VIP的高光谱特征重要性分析
特征重要性分析不仅验证了传统植被指数的科学性,还发现了胁迫特异性响应模式。水分胁迫主要表现为SHAP值整体下移,而氮素胁迫则表现为峰值衰减和谷值加深,这些发现为理解模型决策机制和优化特征选择提供了新视角。
该研究通过创新的数据集构建策略和模型框架设计,成功解决了复合胁迫下作物早期产量预测的难题。APEL-PLSR框架在保持较高预测精度的同时显著降低了均方根误差,多胁迫源数据集融合策略有效提升了模型在复杂环境下的泛化能力。研究结果不仅为作物育种和田间管理提供了实用的技术工具,也为遥感与机器学习在农业中的应用开辟了新思路。特别是在气候变化导致极端天气频发的背景下,这种能够适应复杂胁迫环境的预测模型具有重要的实践价值和推广前景。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号