综述:基于智能手机的复杂果园环境下多生育期草莓的实时检测

【字体: 时间:2025年09月29日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  本文推荐一篇基于无人机遥感与机器学习算法的小麦氮营养诊断研究。该研究通过构建临界氮稀释曲线,利用多光谱/高光谱植被指数,结合多种机器学习模型(如RF、XGBoost、ExtraTree),实现了冬小麦氮营养指数(NNI)的跨年度精准预测与空间制图,为智慧农业中的氮肥精准管理提供了重要技术支撑。

  
引言
氮素在作物生长、光合作用、生物量积累和产量形成中起着关键作用。及时准确地获取作物氮素状况对于优化氮素管理和提高作物生产力至关重要。冬小麦作为中国第三大粮食作物,对国家粮食安全和生态可持续性具有重要意义。氮素是冬小麦生长的重要养分,适宜施氮对产量形成有显著影响。氮供应不足会限制作物生长,而施氮过量可能导致倒伏、减产及水土环境污染。因此,监测和诊断冬小麦氮素状况对于防止氮素缺乏和过量施肥、确保稳定高产至关重要。
农业遥感主要包括无人机遥感、卫星遥感和有人机航空遥感。与其他方法相比,无人机遥感具有低空作业、超高空间分辨率影像获取、灵活性强、机动性高、受云层干扰极小以及运营成本显著较低等优势。机器学习与物理模型结合及其在无人机-卫星数据融合中的应用已成为估算作物冠层叶绿素含量的两种突出方法。近年来,随着无人机遥感技术的快速发展,其在农田作物信息监测与提取中的应用大幅扩展。搭载多光谱、高光谱和热红外传感器的无人机平台已成为获取作物氮素信息和监测氮素状况的重要数据源。
配备多光谱或高光谱传感器的无人机(UAV)在农业氮素诊断中相比传统人工采样方法具有诸多优势。无人机可快速捕获精细尺度影像,允许频繁监测作物田间氮素变异性,这种细节水平是人工采样或低分辨率卫星影像无法实现的。与劳动密集型的人工采样相比,无人机能迅速覆盖大面积区域,减少田间劳动力和采样成本,尤其在复杂地形中。无人机遥感能够实现对作物氮素状况(例如通过光谱指数)的无损观测,而不会延误操作或破坏植株,这与传统的破坏性采样不同。无人机采集的影像提供了跨田块和时间的客观、一致数据,最大限度地减少了人工测量中固有的采样偏差和人为误差。无人机平台可轻松部署于不同农场规模和景观中,支持定制飞行路线和在不同环境条件下的快速部署,这种灵活性支撑了可扩展的氮素监测操作。
精准氮素管理策略严重依赖于有效的指标,其中氮营养指数(NNI)已被广泛采纳为评估作物氮素状况及预测产量和品质的关键工具。NNI准确反映了作物在不同生育阶段的氮素供应水平,其基于Ulrich提出的“临界氮浓度(Nc)”概念。Nc代表了实现最大生物量生产所需的最小氮浓度,通常使用负幂函数拟合以建立“临界氮稀释曲线”。当作物在相似环境条件下生长时,其Nc稀释曲线的参数值通常高度一致。
传统上,计算NNI需要田间采样以测定植株或叶片氮浓度和地上部生物量。这个过程是劳动密集型的、破坏性的,并且不适合大规模快速氮素状况监测。因此,随着技术进步,基于无人机的多源遥感结合机器学习算法在NNI估算中吸引了越来越多的关注。例如,Pei等人利用无人机多光谱影像和三种机器学习模型成功预测了棉花整个生长季的冠层NNI。类似地,Tang等人开发了创新的三维最优光谱指数(3D-OSIs)来估算NNI并生成检测图。然而,大多数现有研究集中于冬小麦的单一年份、全生育期氮素诊断,而在不同试验条件下的跨年度NNI预测研究仍然稀缺。此外,大多数研究分别使用无人机搭载的多光谱或高光谱传感器,很少比较分析多光谱和高光谱数据源之间的预测准确性。
因此,本研究旨在解决以下目标:(1) 基于连续两年的田间试验,评估利用前一年不同氮处理数据预测冬小麦跨年度NNI的可行性和准确性;(2) 比较多光谱和高光谱传感器数据,并结合多元线性回归(MLR)模型和四种机器学习模型——随机森林(RF)、极限梯度提升(XGBoost)、K-最近邻(KNN)和极端随机树(ExtraTree)——确定NNI预测的最佳数据源和模型组合;(3) 构建NNI空间分布图,以直观描绘冬小麦的跨年度氮素状况,探索氮营养诊断的直观可视化方法。这些发现旨在为冬小麦栽培中精准高效的氮素管理提供理论基础和技术支持。
材料与方法
研究区与试验设计
田间试验于中国河南省新乡市新乡县进行,该县位于河南省北部平原地区。研究区处于黄河与海河流域之间,黄河流经新乡约170公里,流域面积4558平方公里。地势自北向南倾斜,土壤肥沃,太阳辐射充足,表层土壤质地为轻壤土。该地区属暖温带大陆性季风气候,四季分明——冬季寒冷、夏季炎热、春季早、秋季凉。年平均日照时数约2400小时,年平均气温14°C;最热月为7月(平均气温27.3°C),最冷月为1月(平均气温0.2°C)。年平均降水量573.4毫米,平均相对湿度68%,无霜期约220天。地下水深度超过10米。这些生态条件非常适宜冬小麦的栽培与生长。
试验在2023-2024生长季于中国农业科学院新乡综合试验站(35.2°N, 113.8°E)进行。为研究冬小麦对不同氮供应水平的响应,建立了连续两年的氮亏缺胁迫试验。尿素(氮含量46%)作为氮肥来源。2023年设置了五个氮施用梯度,2024年设置了四个梯度。每个氮处理重复三次,每个重复包括10个冬小麦品种,因此每个处理有30个小区。两年中使用的品种包括中麦578、山农36、烟农1212、吨麦88、济麦22、百农矮抗58、勒图808、百农207、登海202和鲁原502。小区大小在2023年为4米×1.4米,2024年为5米×1.4米。相邻小区横向距离0.6米,纵向距离1.0米。田间管理措施,包括病虫害和杂草防控,遵循当地农艺建议,以确保作物健康生长和高产。
数据获取
无人机数据获取
使用大疆M210无人机平台(DJI Innovations,中国深圳)搭载MicaSense RedEdge-MX多光谱相机采集冬小麦多光谱冠层影像。此外,使用大疆M600 Pro六旋翼无人机,配备轻量型Resonon Pika L Nano高光谱成像系统(Resonon Inc.,美国Bozeman)、Xenoplan 1.4/1.7-0903镜头(Schneider Optical Technologies,中国深圳)和SBG Systems Ellipse2-N惯性导航系统(SBG Systems Co.,法国巴黎)采集高光谱反射率数据。
RedEdge-MX多光谱传感器具有五个波段——蓝、绿、红、红边和近红外——图像空间分辨率为1280×960像素。光谱带宽对于蓝光和绿光波段为20 nm,红光和红边波段为10 nm,近红外波段为40 nm。该传感器还包括自动曝光调整功能,以在不同光照条件下优化图像质量。Resonon Pika L Nano高光谱成像仪覆盖400至1000 nm的光谱范围,提供300个连续光谱通道,光谱分辨率为2.1 nm,适用于高分辨率作物氮素诊断。
在2023和2024生长季,于拔节期、抽穗期和灌浆期进行了无人机飞行。影像采集安排在上午11:00至下午1:00之间,以确保光照稳定和适中的太阳高度角,有利于捕获高质量影像。大疆M210的飞行任务使用DJI GS PRO软件进行规划,实现自动飞行控制。飞行高度设置为30米,前后重叠度85%,旁向重叠度80%,以确保完全覆盖和高质量图像拼接。每次飞行前后,拍摄校准反射率板的图像用于辐射定标,以确保不同飞行间的一致性和可比性。
对于使用大疆M600 Pro的高光谱数据采集,飞行高度设置为50米,旁向重叠度50%,飞行速度5 m/s, resulting in a ground sampling distance (GSD) of 2.5 cm。在试验区域内放置了三个具有不同反射率值(95%白、40%灰、5%黑)的标准反射率校准板,以方便辐射和几何校正。此外,在研究区域内均匀分布了12个地面控制点(GCP),并使用差分GPS(DGPS)进行测量,以实现无人机影像的厘米级空间精度。
地面测量
地面实况数据收集包括植株氮浓度(PNC)和地上部生物量(AGB)的测量。采样在2023和2024生长季的拔节期、抽穗期和灌浆期进行。在每个小区,随机选择并收获10株有代表性的冬小麦植株。新鲜生物量在收获后立即通过称量密封样品记录。
然后将样品进行烘箱干燥——首先在105°C下30分钟以停止酶活性,随后在85°C下干燥72小时直至恒重。然后测量干生物量。干燥样品经研磨、过筛,每个样品取0.15克用5 mL浓硫酸消解过夜。消解过程使用过氧化氢和消解炉加速,直至溶液变清。冷却后,将消化液转移至100 mL容量瓶并稀释。上清液中的氮浓度使用SEAL AA3连续流动分析仪测定。
数据处理与分析
无人机影像预处理
无人机采集的多光谱影像使用Pix4D Mapper Pro软件进行预处理。首先,将位置信息(POS数据)导入Pix4D,并基于飞行路径生成稀疏点云以构建初始3D模型。随后,导入具有高精度坐标的地面控制点(GCP),并采用先进摄影测量算法自动对齐图像,通过重叠区域的特征匹配实现高精度图像配准。图像对齐后,基于每次飞行前后捕获的反射率板图像进行辐射定标,确保所有光谱波段辐射值的一致性和物理意义。然后使用图像匹配算法生成密集点云,作为构建研究区高分辨率数字正射影像(DOM)的基础。最终的正射影像以TIFF格式导出,用于后续分析,如植被指数(VI)计算和冠层参数提取。在ArcMap 10.5中,通过将导出的正射影像划分为感兴趣区域并提取每个区域的光谱信息进行进一步处理。具体而言,在2023和2024年,正射影像分别被分割为150和120个具有唯一ID的样本小区,并提取每个小区的多光谱反射率数据。使用栅格计算器基于多光谱波段计算常见植被指数。为确保聚焦于试验区域,创建了shapefile以掩膜边缘区域,并相应地裁剪了研究区。
高光谱影像预处理使用SpectrononPro 3.4.0软件(Resonon Inc.,美国Bozeman)进行。导入GCP和反射率校准板测量值用于辐射校正和图像镶嵌。高光谱影像的辐射定标通过应用经验线校正进行,由此将捕获为数字值(DN)的光谱辐射值转换为反射率,使用现场参考目标。具体而言,放置在冬小麦小区上的白参考板用于推导转换函数,将高光谱DN值映射到反射率测量值。同时,对于几何校正,我们利用来自无人机的GPS/IMU衍生位置和姿态数据对图像帧进行正射校正和地理配准,确保空间精度并与地面坐标对齐。进一步,使用ENVI 5.6软件(NV5 Geospatial Co.,美国科罗拉多)从辐射校正后的图像中提取每个小区的平均高光谱反射率值。使用三次插值法将原始300个波段插值到对应400至1000 nm波长,该方法能保持数据平滑性和连续性而不导致信息丢失。此外,采用Savitzky-Golay滤波器消除噪声,减少噪声干扰以增强高光谱数据的平滑性和一致性。
植被指数选择
植被指数(VIs)是多个光谱波段反射率值的数学组合,以线性或非线性方式构建。VIs旨在增强植被特征信号,并能有效反映一定条件下植被的生长状况。与单波段反射率相比,VIs是植被生理生化状况更敏感的指标,并已广泛应用于农业遥感研究,包括作物监测、氮素诊断和生物量估算。
在本研究中,基于对相关文献的广泛回顾与综合,选择了13个常用植被指数用于冬小麦氮素状况的定量监测与评估。所选指数涵盖基于可见光、近红外和红边光谱波段的模型。每个VI的计算公式和相应光谱波段信息列于表中。
氮营养指数(NNI)
“临界氮浓度”(Nc, %)的概念最初由Ulrich提出,指的是作物实现最大生物量积累所需的最小氮浓度。通过构建作物特异性临界氮稀释曲线,可以评估作物在不同生育阶段的氮素状况,从而揭示氮需求与氮供应之间的关系,为优化施肥策略提供理论基础。为准确构建临界氮(Nc)稀释曲线,我们使用基于统计的两步法将处理分为氮限制和非氮限制组。方差分析和事后检验:在每个采样日期,对不同氮水平下的地上部生物量(AGB)观测值进行方差分析(ANOVA),随后在95%置信水平(α=0.05)下进行Fisher's LSD(最小显著差异)事后检验。那些随着氮水平增加AGB显著增加的处理(即较高氮导致显著更大生物量;p≤0.05)被分类为氮限制。相反,那些尽管氮进一步增加但未显示显著生物量增益的处理被定义为非氮限制,表明氮不再限制生长。
临界氮稀释曲线通常表示为:Nc = a × DMmax-b 其中:Nc 是临界氮浓度(%),a是地上部干物质为1 Mg/ha时的氮浓度,DMmax是最大地上部干物质(Mg/ha),b代表植株氮浓度相对于作物相对生长率的下降速率。
为评估这些参数 across years and cultivars的稳健性,该模型分别针对2023和2024年的每个品种进行拟合。使用Bootstrap重采样方法(n=1000次迭代)获得估计参数的标准误差和95%置信区间。这一过程使我们能够量化参数估计的不确定性,并比较年份或品种间的差异是否具有统计意义。
氮素诊断对于精准施氮至关重要。临界氮稀释曲线是随时间监测作物氮营养的动态工具。为进一步量化作物氮素状况,使用氮营养指数(NNI),计算公式为:NNI = Ni / Nc 其中:Ni是实际氮浓度(%),Nc是临界氮浓度(%)。NNI值等于1表示最优氮素状况。当NNI > 1时,表明氮过剩,不需要额外补氮。当NNI < 1时,表明氮缺乏,标志着需要施氮肥。
模型构建
基于无人机平台采集的多光谱和高光谱数据,开发了多元线性回归模型(MLR)和四种独立的机器学习回归模型用于氮营养指数(NNI)预测:随机森林(RF)、极限梯度提升(XGBoost)、K-最近邻(KNN)和极端随机树(ExtraTree)。这些算法已在相关研究中广泛应用,并表现出强大的预测性能、泛化能力和稳健性。各模型的基本原理和特点简述如下。
MLR
多元线性回归(MLR)是农业和环境研究中广泛使用的统计建模技术,用于量化作物参数与多个解释变量之间的关系。该方法假设因变量是几个预测变量的线性组合,表示为:NNI = β0 + β1x1 + β2x2 + ... + βpxp + ε 其中NNI表示氮营养指数,x1, x2, ..., xp代表解释变量,如多光谱植被指数,β0是截距,β1, ..., βp是回归系数,ε是随机误差项。使用普通最小二乘(OLS)方法估计系数,该方法最小化观测值与预测值之间残差的平方和。
在精准农业中,MLR能够整合多个遥感指标,以捕捉冠层光谱反射率、植被结构性状和环境条件对作物氮素状况的综合影响。在本研究中,MLR被应用于结合多光谱植被指数来估算冬小麦的NNI,提供了一个透明且可解释的框架来评估不同生育阶段的氮素状况。
RF
RF是一种基于Bagging概念的非参数集成学习方法。它由多个决策树组成,每棵树在不同的Bootstrap样本上构建,这些样本从训练数据集中随机抽取。在树内的每次分割处,随机选择一个特征子集来确定最佳分割,从而减少树间的相关性并增强集成的泛化能力。
随机森林模型的最终预测是通过对所有个体树的输出取平均得到的。该方法通过集成众多弱回归器,有效降低了模型方差并提高了预测精度。RF回归的性能受几个关键超参数影响,包括:n_estimators:森林中树的数量;增加树的数量可以减少方差但也会增加计算成本。max_features:在每个节点考虑用于分割的特征数量;调整此参数可以平衡随机性和树的相关性。max_depth:每棵树的最大深度;限制树深度可以防止过拟合, although overly shallow trees may lead to underfitting。
XGBoost
XGBoost是一种基于梯度提升框架的集成学习方法。基本思想是 sequentially 构建一系列决策树,其中每棵树旨在纠正前一棵树的残差错误。通过迭代添加新树,模型通过提升策略逐渐最小化整体预测误差。XGBoost在几个方面增强了传统梯度提升,包括:控制模型复杂度和防止过拟合的正则化技术。使用损失函数的二阶泰勒展开近似以加速优化。并行化树构建以提高计算效率。显著影响XGBoost回归性能的关键超参数包括:learning_rate:控制每棵个体树对最终预测的贡献;较小的值通常导致更好的泛化但需要更多的树。max_depth:限制每棵树的最大深度以防止过拟合。lambda和gamma:通过约束叶节点权重来惩罚过于复杂模型的正则化参数。
XGBoost以其卓越的可扩展性和预测准确性而闻名,尤其是在结构化数据上,使其成为机器学习竞赛和实际应用中最广泛使用的算法之一。
KNN
KNN回归是一种非参数的、基于实例的学习方法,其原理与KNN分类相似,但设计用于预测连续值而非离散类别。KNN回归不对底层数据分布做任何假设。相反,它直接依赖训练数据执行预测。
KNN回归的核心思想是基于距离度量(通常是欧几里得距离)识别与给定输入最相似的k个实例(邻居)。然后,新实例的预测值计算为这些邻居目标值的平均值(有时是加权平均值)。影响KNN回归性能的关键因素包括:k(邻居数量):较小的k可以捕捉局部变化但可能对噪声敏感;较大的k可以平滑预测但可能忽略局部结构。distance metric:常见度量包括欧几里得距离、曼哈顿距离和闵可夫斯基距离;选择影响相似性度量方式。feature scaling:由于KNN对特征尺度敏感,通常需要进行数据预处理,如归一化或标准化。
KNN回归实现简单,并且可以在输入特征与目标变量之间的关系高度局部化和非线性
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号