
-
生物通官微
陪你抓住生命科技
跳动的脉搏
结合高光谱数据与人工智能技术提升马铃薯生物物理与生化性状预测研究
【字体: 大 中 小 】 时间:2025年09月24日 来源:Agronomy Journal 2
编辑推荐:
本研究系统评估了高光谱遥感结合机器学习(ML)与深度学习(DL)模型在预测马铃薯氮素吸收量、生物量及块茎产量中的应用。研究比较了多种光谱预处理方法(原始光谱、SG平滑、一阶导数变换)和六种预测模型(包括SVR、PLSR、RFR、RR、Lasso和1D-CNN),发现一阶导数预处理结合1D-CNN模型在氮吸收(R2=0.82)和生物量估算(R2=0.84)中表现最优,而RR模型在产量预测中效果最佳(R2=0.67)。研究通过SHAP分析揭示了关键光谱区域,为基于高光谱的精准氮肥管理提供了理论依据与技术支撑。
本研究聚焦于利用高光谱遥感技术与人工智能方法,实现对马铃薯(Solanum tuberosum L.)关键农艺性状——氮素吸收、生物量积累及最终块茎产量的精准、无损预测。通过系统比较不同光谱预处理策略与多种机器学习及深度学习算法,研究旨在为马铃薯生产中的氮肥精准管理提供可靠的数据驱动方案。
马铃薯是美国消费量最大的蔬菜作物,年产量约2000万吨。氮素(N)是影响马铃薯生长与块茎发育的关键大量营养元素,其缺乏或过量均会导致产量与品质下降。传统的植株氮素与生物量监测方法依赖破坏性采样,耗时费力且难以捕捉田间尺度的空间变异。因此,开发高效、无损的遥感监测技术具有重要意义。高光谱遥感能捕获350–2500 nm范围内连续、精细的光谱信息,对植被的生理生化变化高度敏感,近年来被广泛应用于作物性状估算。然而,多数研究仍基于植被指数或有限波段,未能充分利用全光谱信息。机器学习(ML)与深度学习(DL)方法的发展为高光谱数据的解析提供了新的途径,但模型可解释性仍是挑战。SHapley Additive exPlanations(SHAP)分析有助于揭示“黑箱”模型的决策机制。本研究首次在美国佛罗里达州的马铃薯生产体系中,系统评估了多种ML/DL模型结合高光谱数据在估算氮吸收、生物量及预测产量方面的表现。
试验于2023与2024生长季在佛罗里达大学Hastings农业推广中心的两个试验点进行。土壤类型为Holopaw细砂土,采用裂区设计,主区为5个氮水平(0、78、157、235、314 kg N ha-1),副区为细菌生物刺激剂处理。马铃薯品种为Atlantic,行距1 m,株距20 cm。氮肥分三次施用,磷钾肥基施。
在地面真值采集同日(营养生长、块茎形成及膨大期)使用ASD FieldSpec 4光谱仪测量冠层光谱反射率(350–2500 nm)。每个样点采集3条光谱并平均。植株样品经烘干、称重、研磨后,采用燃烧法测定全氮含量,并计算氮吸收量(生物量×氮浓度)和最终块茎产量。
剔除水汽吸收严重的波段(1331–1480 nm, 1791–1960 nm, 2301–2500 nm)后,比较三种预处理方法:原始光谱、Savitzky–Golay(SG)滤波和一阶导数(FD)变换。SG滤波参数为多项式阶数3、窗口宽度13。
将数据按7:3随机分为训练集与测试集,采用分层抽样保证不同氮处理、生长阶段、地点和年份的代表性。评估的模型包括支持向量回归(SVR)、偏最小二乘回归(PLSR)、随机森林回归(RFR)、岭回归(RR)、最小绝对收缩与选择算子回归(Lasso)和一维卷积神经网络(1D-CNN)。采用GridSearchCV(ML模型)或贝叶斯优化(1D-CNN)进行超参数调优,以五折交叉验证确定最优参数。
SVR:采用高斯径向基函数核,通过间隔优化处理非线性关系。
RFR:集成多棵决策树,通过袋外误差估计内部验证。
PLSR:通过潜在变量降维,处理高维共线性数据。
RR与Lasso:分别引入L2与L1正则化,防止过拟合。
1D-CNN:包含两个一维卷积层(64和128个滤波器)、池化层、全连接层和Dropout正则化,使用Adam优化器与He-Normal初始化。
采用决定系数(R2)和归一化均方根误差百分比(nRMSE%)评价模型性能。
采用SHAP分析解释模型预测,使用KernelExplainer(线性模型)、TreeExplainer(RFR)和DeepExplainer(1D-CNN)计算各波段贡献值。
分析基于Python 3.10.9,使用scikit-learn(ML模型)、TensorFlow/Keras(1D-CNN)和shap库(可解释性分析)。
反射光谱显示,高氮处理(235、314 kg N ha-1)在近红外区(700–1300 nm)反射率更高,这与叶绿素含量及冠层密度增加一致;低氮处理(0、78 kg N ha-1)反射率较低,表明生物量与叶绿素水平下降。
FD变换显著提升了生物量与氮吸收的预测精度,1D-CNN结合FD数据取得最优表现(生物量R2=0.84,氮吸收R2=0.82)。FD通过增强光谱拐点与峰值特征,有效突出了与生理性状相关的细微光谱变异,并减少了土壤背景干扰。SG滤波虽平滑噪声,但过度平滑可能损失关键光谱信息。
氮吸收估算:1D-CNN表现最佳(测试集R2=0.82,nRMSE%=12.7),其次为SVR和RR。PLSR与Lasso表现较差。
生物量估算:1D-CNN同样最优(R2=0.84,nRMSE%=9.8),RFR与RR次之。Lasso因线性假设限制,表现最差。
1D-CNN通过非线性激活函数捕捉复杂光谱交互,优于传统ML模型。RFR在训练集表现好但测试集泛化能力下降,存在过拟合风险。
基于块茎形成期与膨大期FD光谱数据预测产量。RR模型在两个时期均表现最佳(形成期R2=0.67,nRMSE%=12.75;膨大期R2=0.60,nRMSE%=11.49)。随着冠层生物量增加,光谱饱和效应加剧,预测精度下降。RFR与1D-CNN因数据量有限(n=140)表现不佳,易过拟合。RR通过正则化处理共线性,适用于小数据集预测。
通过SHAP分析揭示关键波段:
氮吸收与生物量:可见区(485、637 nm)与近红外区(919、1174 nm)贡献最大,分别关联叶绿素吸收、水分含量与纤维素/木质素特征。
产量预测:458 nm(蓝光)、670 nm(红光)与1253 nm(短波红外)最关键,分别反映光合效率、叶绿素吸收与水分状态。2130 nm附近波段与氮氢键(N-H)伸缩相关,指示蛋白质含量与氮代谢。
本研究证明了高光谱技术结合AI模型在马铃薯精准氮管理中的潜力。随着高分 hyperspectral 卫星(如Pixxel,5 m分辨率)的发射,该技术有望大规模应用。早期产量预测(R2=0.67)可为追肥决策提供支持,提升氮肥利用率(NUE),减少环境污染。当前局限包括数据预处理复杂、传感器成本高、模型泛化性需多地点验证。未来可融合气象、土壤及LiDAR数据提升精度,并开发用户友好工具促进技术采纳。
高光谱数据结合ML/DL模型可实现马铃薯氮吸收、生物量与产量的准确估算。FD预处理与1D-CNN组合在性状估算中最优,而RR更适合产量预测。SHAP分析明确了关键光谱区域,为开发实时监测工具提供了依据。随着高光谱技术发展,该研究将推动精准农业与智慧决策系统的进步。
生物通微信公众号
知名企业招聘