
-
生物通官微
陪你抓住生命科技
跳动的脉搏
融合无人机多源数据与物候信息的小麦地上生物量预测模型研究
【字体: 大 中 小 】 时间:2025年09月12日 来源:Information Processing in Agriculture 7.4
编辑推荐:
本研究针对作物地上生物量(AGB)实时精准监测的需求,通过集成无人机多源遥感特征(植被指数VIs、纹理特征TFs和形态特征MC)与物候信息(PI),采用随机森林(RF)、Lasso回归(LR)、K近邻(KNN)及其堆叠集成学习(SML)四种机器学习算法,构建了小麦AGB高精度预测模型。结果表明SML模型表现最优(R2=0.92, RMSE=1.57 Mg ha?1),特征重要性分析揭示植被指数和株高在营养生长期起主导作用,而纹理特征在生殖生长期显著缓解光谱饱和效应。该研究为多源遥感数据融合建模提供了方法论创新,对智慧农业管理具有重要实践意义。
随着全球人口增长和气候变化加剧,粮食安全面临严峻挑战。小麦作为全球35%人口的主粮作物,其产量稳定对保障粮食安全至关重要。传统农业生产中,为提高产量往往增加水肥投入,但这导致资源利用效率下降和环境污染风险加剧。地上生物量(Above-ground Biomass, AGB)是反映作物生长状况的关键指标,实时精准监测AGB对优化田间管理、提高资源利用效率和实现可持续增产具有重要意义。
长期以来,AGB监测主要依赖破坏性采样方法,耗时费力且难以实现大面积应用。卫星遥感技术虽能实现大范围监测,但其空间分辨率不足难以捕捉田间小尺度变异。无人机(Unmanned Aerial Vehicle, UAV)遥感技术以其成本效益高、空间分辨率高等优势,成为农田尺度作物监测的有力工具。
然而,当前研究仍面临多个挑战:一是无人机获取的多源特征(包括植被指数VIs、纹理特征TFs和形态特征MC)在AGB预测中的贡献度和可转移性尚不明确;二是不同机器学习算法对多源数据的利用效率存在差异;三是特征重要性随作物生长阶段的变化规律缺乏系统解析;四是模型在不同环境条件下的泛化能力有待验证。
为应对这些挑战,中国农业大学农学院的研究团队在《Information Processing in Agriculture》发表了题为"Fusing UAV multiple data and phenology to predict crop biomass"的研究论文。该研究通过整合无人机多源遥感数据和物候信息,采用多种机器学习算法,系统评估了不同特征在冬小麦AGB预测中的贡献度和跨生长阶段可转移性。
研究人员在黄淮海平原两个试验点开展了四年田间试验,设置了不同的水氮处理和作物轮作模式,构建了包含多生长阶段的AGB数据集。利用大疆精灵4多光谱无人机获取高清遥感影像,提取了15种植被指数(包括DVI、EVI、MCARI、MNLI、MSAVI、LCI、EVI2、MSR、NDRE、NDVI、SAVI、GNDVI、NRI、CIG和RVI)、40个纹理特征(基于灰度共生矩阵GLCM计算的均值、方差、同质性、对比度、相异性、熵、角二阶矩和相关性)以及3种形态特征(冠层体积、株高和冠层覆盖率)。同时引入物候信息,采用发育阶段(Development Stage, DVS)量化作物生育进程。
关键技术方法包括:1)采用递归特征消除(RFE)进行特征选择,从56个初始特征中筛选出14个关键特征;2)应用四种机器学习算法(RF、LR、KNN和SML)构建预测模型,其中SML采用多元线性回归作为元模型集成三种基模型;3)使用SHAP值和Sobol敏感性分析解析特征重要性;4)通过外部站点验证评估模型转移能力。
研究结果揭示了AGB的动态变化规律。在不同年份和试验点间,AGB表现出显著变异,2022年营养生长期、开花期和灌浆期平均AGB分别为3.0、12.0和14.7 Mg ha?1,2023年相应为4.2、11.5和15.3 Mg ha?1,而河北试验点(Exp. 4)的AGB普遍较低。这种变异主要源于作物轮作、水氮管理等处理差异,为模型校准提供了充分的数据变异性。
特征与AGB的相关性分析表明,不同生长阶段主导特征存在明显差异。营养生长期,植被指数和株高与AGB相关性最强(r>0.70);开花期EVI2和LCI相关性最高(r>0.70);灌浆期所有特征相关性普遍降低,近红外波段均值相关性最高(r=0.60)。跨生长阶段分析显示,株高和绿波段对比度与AGB保持较高相关性(r>0.70)。
机器学习模型比较显示,所有算法均表现出良好预测能力。RF、LR、KNN和SML的验证集RMSE分别为1.64、1.71、1.71和1.57 Mg ha?1,rRMSE分别为18%、18%、18%和17%。其中SML集成方法综合了各算法优势,预测精度最高(R2=0.92)。
通过Sobol敏感性分析和SHAP值解析,研究人员揭示了不同算法对特征类型的偏好性:RF主要依赖株高特征,LR优先利用植被指数,KNN侧重纹理特征,而SML则能综合各算法优势。更重要的是,特征重要性随生育阶段动态变化:营养生长期植被指数和株高起主导作用;开花期株高重要性显著增加;灌浆期纹理特征贡献度最大,能有效缓解光谱饱和效应。
多特征组合效应评估表明,特征融合显著提高预测精度。单一特征模型中,仅基于植被指数的模型表现最差(R2=0.69);加入物候信息后,所有特征类型预测精度均显著提升,其中植被指数与物候信息组合改善最明显(R2从0.69提升至0.91)。所有特征组合(VIs+TFs+MC+DVS)达到最优预测性能(R2=0.92, RMSE=1.57 Mg ha?1, rRMSE=17%)。
模型转移性评估显示,不同生长阶段模型表现存在差异。营养生长期,植被指数、形态特征和物候信息组合模型精度最高(R2=0.88, rRMSE=20%),加入纹理特征反而降低精度;开花期,植被指数与物候信息组合表现最佳(R2=0.95, rRMSE=13%);灌浆期,所有特征组合达到最高精度(R2=0.87, rRMSE=18%)。跨生长阶段分析表明,基于形态特征的模型转移性最好(R2=0.85),而纹理特征与物候信息组合的转移性较差(R2=0.33)。
研究结论与讨论部分强调了多源数据融合与集成学习的协同优势。与传统单一模型相比,堆叠集成学习(SML)通过元模型整合不同算法的特征偏好,实现了更全面和准确的多源数据模式捕捉。这种算法结构的多样性为充分利用多源数据优势提供了新途径。
特征组合的互补效应是提高预测精度的关键。植被指数主要反映作物覆盖度和光合色素特征,株高指示冠层垂直结构,纹理特征表征冠层表面结构,而物候信息则捕捉生理发育进程。这种多角度信息互补有效克服了单一数据源的局限性,特别是纹理特征在生殖生长阶段对光谱饱和效应的缓解作用。
研究还发现了纹理特征转移性的局限性:在不同试验点间,相同纹理特征可能代表不同的生物量水平,这主要源于气候条件和管理措施(如行距、种植密度)差异导致的冠层结构变异。特别是在营养生长期,土壤反射对纹理特征的噪声干扰显著限制了其转移性。
该研究的实践意义在于为田间管理提供了阶段性指导策略:营养生长期应重点关注植被指数和株高变化以评估作物营养状况;生殖生长期则需结合纹理特征来评估生长状况并调整管理措施。这种阶段特异性特征选择策略为无人机生物量监测的业务化应用提供了新思路。
研究局限性包括形态特征和纹理特征计算需要较多计算资源,以及目前仅使用了多光谱数据。未来研究可整合多源传感器(如高光谱、LiDAR)、作物生长模型和3D辐射传输模型,通过生成全生育期冠层性状合成数据训练知识引导的机器学习框架,从而增强模型在不同地点和生长阶段的泛化能力。
这项研究不仅为无人机多源遥感数据融合建模提供了方法论创新,也为智慧农业管理提供了重要技术支撑。通过明确不同特征类型在不同生长阶段的贡献度和可转移性,该研究为实现作物生物量的精准监测和高效管理提供了科学依据和实践指南。
生物通微信公众号
知名企业招聘