《Smart Agricultural Technology》:Precise profiling of behavioral time budgets of finishing Wagyu steers using linear mixed model
编辑推荐:
本文针对小麦叶片氮含量(LNC)遥感监测中模型精度和泛化能力受时空变异制约的难题,提出了一种融合信号增强、特征选择与智能优化算法的级联优化框架。研究通过SG平滑、一阶微分和CWT等多尺度光谱变换,结合SPA特征筛选,构建了SSA优化的XGBoost和AHA优化的ELM反演模型。结果表明,XGBoost-SSA模型在测试集上R2达0.79,RMSE为0.14 mg/g,独立验证集上R2保持0.73,显著提升了LNC监测的精度与鲁棒性,为智慧农业提供了可靠的技术支持。
氮是构成叶绿素、蛋白质和酶的关键元素,直接影响小麦的光合效率和产量形成。传统测定叶片氮含量(LNC)的化学方法虽准确,但依赖破坏性取样,耗时费力,难以满足现代精准农业对实时、无损、大范围监测的需求。近年来,高光谱遥感技术为作物氮素监测提供了新途径,然而现有模型在复杂田间条件下的泛化能力仍然有限,存在站点依赖性高、跨生长阶段精度下降、以及非氮因素(如叶片结构和水分)干扰等问题。
针对这些挑战,发表在《Smart Agricultural Technology》上的研究开发了一种创新的级联优化框架,将信号增强、特征纯化和群体智能优化相结合,实现了小麦LNC的高精度估算。该研究通过整合多年度、多品种的田间试验数据,构建了一套从数据采集、处理到模型构建与评估的完整技术路线。
研究人员主要采用了以下关键技术方法:使用FieldSpec? 4 Hi-Res光谱辐射计采集小麦冠层高光谱反射率数据;应用Savitzky-Golay(SG)平滑和一阶导数(FD)变换进行光谱预处理;采用连续小波变换(CWT)进行多尺度光谱特征提取,重点分析了gaus8小波基函数在尺度21至21?范围内的分解效果;利用连续投影算法(SPA)进行特征波长筛选;分别构建了麻雀搜索算法(SSA)优化的极限梯度提升(XGBoost)模型和人工蜂鸟算法(AHA)优化的极限学习机(ELM)模型,并与多元线性回归(MLR)、随机森林(RF)和支持向量回归(SVM)等基线模型进行对比。实验数据来源于2016、2024和2025年在江苏进行的田间试验,涵盖了返青、拔节、孕穗和开花四个关键生育期,共480个样本。
3.1. 不同生育期小麦冠层光谱变换分析
研究发现,经过SG平滑后的光谱曲线更为平滑,而一阶导数变换增强了局部光谱变异特征。CWT在不同尺度下分解光谱信号,尺度32、64和128被确定为最佳分解水平,这些尺度能有效放大氮敏感峰值,增强多尺度分析下小麦叶片氮素特征提取的精度。
3.2. 相关性分析
植被指数与LNC的相关性分析表明,NDVI和RVI与LNC的相关性最强,最大相关系数分别达到0.54和0.59。与FD相比,尺度64-256范围内的CWT提取了更多特征波段,且在全光谱范围内分布更均匀,显示出在噪声抑制和特征提取方面的优势。
3.3. 特征选择
SPA特征选择结果表明,CWT尺度64条件下筛选出的97个特征波段能实现最佳预测性能,测试集RMSE为0.21 mg/g。当特征数减少至24个时,精度损失不到3%,表明模型在保持高精度的同时实现了显著的特征压缩。
3.4. 小麦LNC反演模型构建
模型比较结果显示,XGBoost-SSA模型表现最优,在测试集上R2为0.79,RMSE为0.14 mg/g,MAPE为9.31%。经SSA优化后,XGBoost模型的R2提升了25.4%,RMSE降低了26.3%。而ELM-AHA模型在独立验证集上表现下降,表明XGBoost架构具有更强的泛化能力。
3.5. 模型验证
在独立外部验证集上,XGBoost-SSA模型保持了良好的泛化能力,R2为0.73,RMSE为0.14 mg/g,MAPE为9.63%,显著优于ELM-AHA模型,证实了其在不同品种和生长环境下的适用性。
4.1. 不同预处理方法对小麦LNC估算的影响
研究表明,SG-CWT预处理策略显著提高了模型精度,尺度64的CWT分解结合SPA特征选择能平衡特征丰富度和噪声抑制,是实现高精度LNC反演的关键。
4.2. 特征选择策略的影响
相关分析+SPA的两步特征选择策略在保持模型精度的同时,将特征数从2149个压缩至24个,计算时间从900秒减少到53秒,极大提升了建模效率。
4.3. 机器学习算法比较
XGBoost-SSA在精度和鲁棒性方面均优于ELM-AHA,其集成学习框架和正则化机制能更好地处理高维非线性光谱数据,避免过拟合。
4.4. 基于SHAP的特征重要性和可解释性分析
SHAP分析揭示了紫外线-蓝色区域(379-471纳米)、可见光绿色区域(527-611纳米)和短波红外区域(1571-2473纳米)对LNC预测的重要贡献,这些波段分别与叶绿素吸收、光合能力以及蛋白质、木质素等含氮化合物相关,为模型提供了生理学解释。
4.5. 实际意义、研究前景与局限性
该研究提出的SG-CWT-SPA-VIs-XGBoost-SSA框架为小麦氮素监测提供了新的技术范式,但在不同土壤类型、气候区的普适性仍需进一步验证。未来可与无人机多光谱成像和卫星数据结合,实现从田间到区域尺度的扩展应用。
研究结论表明,中尺度CWT结合SPA特征选择是小麦LNC估算的有效预处理策略。经过SSA优化后,XGBoost模型在测试集上R2达到0.79,在独立验证集上保持0.73,显示出优越的预测性能和泛化能力。该框架通过多尺度光谱增强、自适应特征纯化和群体智能驱动优化,为高光谱养分诊断提供了新的技术方案,将有助于实现小麦生产中的精准氮素管理,推动智慧农业的发展。