基于无人机多光谱成像与堆叠集成学习的旱区高粱产量预测
【字体:
大
中
小
】
时间:2025年10月10日
来源:Frontiers in Plant Science 4.8
编辑推荐:
本研究创新性地融合无人机多光谱成像与集成学习算法,构建了"光谱-气象-空间"三维预测框架,在旱区高粱产量预测中实现高精度建模(R2达0.9491),揭示了拔节期为核心监测窗口,DVI和NDGI为关键预测因子,为智慧农业提供了重要的技术支撑。
准确预测作物产量对全球粮食安全至关重要,尤其在干旱半干旱地区,气候多变性和水资源短缺给农业可持续性带来重大挑战。高粱作为耐旱C4作物,具有高水分利用效率,是脆弱地区关键的粮食安全解决方案。传统产量估算方法主要依赖人工田间调查和经验模型,成本高、效率低,难以捕捉精准农业所需的精细空间变异性。
无人机技术通过提供高分辨率、及时且成本效益高的作物监测能力,彻底改变了精准农业。与传统卫星遥感相比,无人机具有更优的空间分辨率和时间灵活性,能够检测对精准管理决策至关重要的精细尺度作物变异。机器学习算法与遥感数据的结合已成为作物产量预测的强大方法,在处理农业应用中典型的高维、多重共线性数据方面具有优势。
本研究在山西晋中榆次区丽芳旱作试验基地进行,该区域位于黄土高原中部,具有典型的温带大陆性季风气候,海拔范围767至1777米。区域年平均温度约9.8°C,无霜期120至220天,年降水量约450毫米,主要集中在6月至9月。土壤为黄土与壤质壤土混合物,耕层有机质含量17.6 g·kg-1,全氮含量0.98 g·kg-1。
在2024年高粱生育期(5月至9月),使用大疆Mavic 3M无人机系统收集四个关键物候期(出苗、拔节、开花和成熟)的多光谱数据。飞行高度设置为65米,选择晴朗天气条件(10:00-12:00)执行,航向和旁向重叠率分别为70%和80%。无人机四通道光谱成像系统捕获红(650±16 nm)、绿(560±16 nm)、红边(730±16 nm)和近红外(860±26 nm)波段数据。
田间产量测量于2024年9月25日进行,在试验区选择了18个代表性样地样本,每个样地面积1平方米。收获的高粱风干至稳定水分含量后称重,计算单位面积产量,作为遥感与气象特征回归建模和目标变量评估的产量数据。
考虑到植被指数对特定农艺性状的不同敏感性,本研究利用无人机多光谱传感器通道建立了16个关键植被指数(NDVI、RDVI、NLI、GNDVI、RVI、SAVI、NDGI、DVI、OSAVI、GI、MSR、GRVI、CLgreen、WDRVI、TVI、NDWI),以确定最佳产量监测指标。
系统构建了八种机器学习回归模型用于高粱产量预测,包括lasso回归、岭回归、弹性网络、随机森林、多层感知机、支持向量回归、梯度提升树和线性模型。数据集按8:2比例划分为训练集和测试集,通过5折交叉验证和网格搜索实现超参数优化。
选择四个光谱波段和16个与产量相关的植被指数,结合气象数据作为输入参数,对高粱产量进行建模和分析。模型性能评估指标包括决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE),全面衡量预测准确性和稳定性。
为分析不同输入变量在模型中的解释力和影响力,引入SHAP(Shapley Additive Explanations)方法来解释模型输出。通过计算每个特征在预测过程中的平均边际贡献来识别关键变量。此外,使用PDP(Partial Dependence Plot)方法绘制变量对产量的偏依赖曲线,揭示变量变化对模型预测的单因素响应趋势。
在所有八种模型中,梯度提升(Gradient Boosting)表现最佳,R2为0.9491,RMSE为6.2028,MAE为3.9460,表明最强的拟合能力和预测准确性。随机森林次之,R2为0.9070。线性模型整体表现较弱,R2低于0.80,误差较大。MLPRegressor和SVR的预测结果波动较大,准确性低于集成方法,部分样本点出现明显偏差。
基于对R2、RMSE和MAE的综合评估,优先考虑拟合性能,选择性能最好的前三种模型构建堆叠模型,被确定为高粱产量预测的最佳解决方案。
为评估模型在不同生育期预测高粱产量的能力,基于出苗、拔节、开花和成熟期对产量预测结果进行了分阶段验证。对比高粱四个阶段(出苗、拔节、开花和成熟)的验证结果发现,各阶段提取的特征对产量预测的贡献存在显著差异。
其中,拔节期特征显示出最强的预测能力,模型准确性普遍较高,R2值(R2=0.9454)显著优于其他阶段,表明该时期的遥感和环境信息最能反映最终产量差异;成熟期表现次之,也显示出较强的预测效果;出苗期和成熟期的预测能力相对较弱,可能由于这些阶段植株尚未完全发育或稳定,产量差异尚未完全显现。
SHAP值分析显示,DVI和NDGI是预测模型中最具影响力的特征,其次是TVI、SAVI和GRVI,表明植被指数在高粱产量预测中发挥核心作用。这些光谱指数有效捕捉了作物的关键生理特性,如光合活性、冠层结构和生物量,这些与产量直接相关。
特征值与SHAP值之间的关系揭示了重要模式。对于DVI,较高的指数值(红点)与正SHAP值相关,表明较高的DVI值预测产量增加。相比之下,NDGI表现出双向效应,非常高和非常低的值都可能导致产量预测增加。TVI的影响模式表明中等值对产量预测贡献最大,而非常高的值影响较弱,反映了该指数在特定生长阶段敏感性的非线性关系。
对六个光谱变量(Green、RedEdge、Red、NLI、NIR和DVI)的偏依赖图(PDP)分析显示,这些变量对预测产量的影响在其值范围内存在显著差异,整体响应趋势是非线性的。其中,Green和Red波段在低值范围内对产量预测呈现积极影响,随后趋于稳定。相比之下,NIR和RedEdge在中高值范围内对产量提升更为敏感,反映了作物对这些光谱波段反射率的阶段特异性响应。
使用前一阶段建立的最优产量预测模型,绘制了研究区域内高粱产量的空间分布图。研究区高粱产量表现出明显的空间异质性,具有清晰规律的分布模式。产量值范围从630到730磅/英亩,高产区域(绿色,700-730磅/英亩)和中产区域(黄色,670-690磅/英亩)形成南北走向的交替条带模式。
产量梯度分析进一步证实了这种条带结构,较高梯度值区域(红色条带)与产量变异边界对齐,突显了产量的东西向变异特征。
空间自相关分析揭示了研究区高粱产量存在显著的空间依赖性。全局Moran's I指数为0.5552,表明产量分布存在中等正空间自相关,意味着具有相似产量水平的区域倾向于在空间上聚集。局部Moran's I指数的空间分布图显示研究区主要为浅蓝色,呈现清晰的条带分布模式,该模式与原始产量分布特征一致,进一步证实了产量分布的空间结构。
使用快速傅里叶变换(FFT)的空间频率分析揭示了高粱产量数据的周期性结构特征。频谱图中心区域存在的水平亮带表明研究区垂直方向存在规则的周期性变化。这种频率特征与先前观察到的产量分布条带模式一致,从频域角度进一步证实了产量分布的方向依赖性。频率强度相对集中分布表明产量具有更规则的空间周期性。
本研究通过整合无人机多光谱技术与气象数据,在高粱产量预测方面取得了一系列重要发现。集成学习模型(如梯度提升和随机森林)在高粱产量预测中表现出最高性能,R2值分别达到0.93和0.91,显著优于传统线性模型。
不同生长阶段预测能力分析表明,拔节期和开花期特征对产量预测贡献最大,R2值分别为0.9454和0.9075。相比之下,出苗期表现出相对较弱的预测能力(R2=0.1371)。这一发现具有实际意义,表明拔节期是高粱生长的关键阶段,植株在此期间快速发育其基本架构,该时期的生长状况直接影响后期产量形成。
空间自相关和频率分析揭示了研究区内高粱产量的空间分布特征。Moran's I指数(I=0.5552)表明产量分布存在中等正空间自相关,形成清晰的条带模式。这种分析方法有效识别田间高产和低产区域,为精准管理提供科学依据。
准确的高粱产量预测对于确保干旱和半干旱地区的粮食安全至关重要,在这些地区,气候变化和水资源短缺给农业可持续性带来越来越大的挑战。传统的产量估算方法无法满足耐旱作物精准农业的要求,需要开发先进的遥感和机器学习方法。
本研究使用无人机多光谱数据结合融合气象数据对高粱产量进行预测和预报,主要得出以下结论:
成功开发了基于无人机多光谱的产量预测系统,实现了 exceptional 准确性(梯度提升R2=0.9491),证明了集成学习方法在处理复杂农业数据方面优于传统线性方法。
系统分析确定了关键植被指数(DVI、NDGI、TVI)作为关键预测因子,为变量速率管理和精准灌溉策略提供了可操作的见解。
确定拔节期和开花期作为最佳监测时期,为降低数据收集成本同时保持高预测准确性提供了实用指导,实现了精准农业中更高效的资源分配。
空间自相关分析(Moran's I=0.5552)揭示了系统产量模式,为特定地点的管理决策和精准农业实践提供了信息。
这些发现对水资源有限环境中的可持续农业具有重要实际意义。开发的框架使农民和农业管理者能够优化灌溉时间,实施变量速率施肥,并做出明智的管理决策,从而提高生产力和资源利用效率。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号