利用基于无人机的多源遥感数据融合技术估算棉花田的土壤含水量

《Agricultural Water Management》:Estimating soil water content of cotton fields using UAV-based multi-source remote sensing data fusion

【字体: 时间:2025年11月21日 来源:Agricultural Water Management 6.5

编辑推荐:

  精准灌溉中的土壤水分含量估算优化:基于多源遥感数据与机器学习算法的协同建模研究。通过构建融合植被指数(NDVI、CWSI)、温度植被指数(TVDI)和三维干旱指数(TDDI)的多维遥感特征集,系统评估了支持向量回归(SVR)、随机森林回归(RFR)、梯度提升决策树(GBDT)和类别梯度提升(CatBoost)四类机器学习模型在棉花关键生长阶段(开花期、结铃期、开花期)不同土壤深度(0-60cm)的估算性能。结果表明,CatBoost模型在SWC20(20cm土层)处达到最优精度(R2=0.762±0.026),其预测稳定性随灌溉量增加而增强,但对深层土壤(SWC50、SWC60)的敏感性降低。研究证实,多源数据融合与机器学习结合可有效提升SWC估算精度,为干旱区棉花精准水分管理提供技术框架。

  在棉花种植过程中,土壤水分含量(SWC)的准确估算对于优化灌溉策略具有至关重要的意义。尤其是在开花、铃期和铃开放阶段,SWC的变化对产量和纤维质量产生直接影响。因此,研究如何更精确地估计土壤水分含量,不仅有助于提高作物生长效率,还能有效提升水资源利用效率。近年来,多源数据融合技术在土壤水分估算中展现出巨大潜力,它能够通过整合不同数据集的优势,提高估算的准确性和鲁棒性。然而,这种技术在全面考虑土壤-植物-大气连续体(SPAC)内部的相互作用方面仍存在一定的局限性。为了克服这一问题,本研究引入了热红外、多光谱和气象数据的多维融合,构建了涵盖作物水分胁迫指数(CWSI)、归一化植被指数(NDVI)、温度植被干旱指数(TVDI)和三维干旱指数(TDDI)的特征集,旨在系统评估机器学习算法在棉花关键生长阶段对SWC的估算能力。

在棉花种植过程中,土壤水分的动态变化直接影响其生长状况和最终的产量与纤维质量。棉花根系主要分布在地表至60厘米深度范围内,因此在这一关键区域的精确水分监测对于调控灌溉策略具有重要意义。为了更准确地反映棉花生长状态,本研究采用无人机遥感技术,结合多光谱和热红外传感器,获取了不同生长阶段的高分辨率影像数据。此外,通过现场采集土壤样本,获取了六个不同深度(0–10、10–20、20–30、30–40、40–50、50–60厘米)的土壤水分含量数据,从而构建了完整的土壤水分数据集。这些数据不仅为模型训练提供了坚实的基础,也使得不同深度的水分变化趋势得以清晰展示。

在数据预处理过程中,首先利用 PIX4D Mapper 4.6 和 ArcGIS 10.8 对无人机获取的多光谱和热红外影像进行拼接、地理配准和裁剪。随后,通过 ENVI 5.3 平台对影像进行二值掩膜处理,以去除土壤背景干扰,从而提取出更准确的植被冠层信息。此外,还进行了辐射校正,确保植被指数的物理意义和时间可比性。经过这些步骤,最终获得了适用于后续分析的高精度数据集。

为了进一步提高土壤水分估算的准确性,本研究构建了多个多维遥感指数。其中,NDVI 是评估植被覆盖度、生长动态和健康状况的关键指标,而 CWSI 通过结合冠层温度和环境条件,能够更全面地反映作物水分胁迫状况。TVDI 则通过整合植被覆盖信息与地表温度变化,用于评估土壤水分状况和植被水分胁迫水平。TDDI 则在 NDVI、CWSI 和空气温度的基础上进行构建,其在不同土壤层中的表现显著优于传统的 NDVI 和 TVDI。这些多维遥感指数的引入,不仅丰富了数据特征空间,也为模型训练提供了更全面的信息支持。

在模型构建阶段,本研究选取了四种主流的机器学习算法:支持向量回归(SVR)、随机森林回归(RFR)、梯度提升决策树(GBDT)和类别提升(CatBoost)。这些算法在处理非线性数据方面各具优势。SVR 通过核函数将数据映射到高维空间,实现最优超平面拟合,从而有效处理复杂非线性关系。RFR 则通过构建多个随机决策树并集成其结果,提升了模型的稳定性和预测精度。GBDT 和 CatBoost 属于 Boosting 算法,通过迭代优化不断修正模型误差,提高整体预测能力。其中,CatBoost 在处理类别特征和梯度偏差方面表现出更强的鲁棒性,因此在本研究中取得了最佳的估算效果。模型训练阶段采用80%的现场数据进行训练,剩余20%用于评估模型的泛化能力。通过五折交叉验证和网格搜索优化模型超参数,确保模型在不同土壤层和不同生长阶段都能保持较高的准确性。

模型性能评估主要基于三个指标:决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)。此外,还引入了共识相关系数(Pc)来衡量模型预测与实际值之间的吻合度。结果显示,CatBoost 模型在所有深度的 SWC 估算中表现出最高的精度(R2 = 0.762 ± 0.026),远超其他模型。相比之下,SVR 和 RFR 的估算能力相对较低,而 GBDT 表现最弱。误差分析表明,CatBoost 在 MAE 和 RMSE 方面均取得最低值,显示出其更强的鲁棒性。值得注意的是,所有模型在估算 SWC60(60 厘米深度)时均表现出较大的误差波动,表明深层土壤水分变化对模型而言更具挑战性。

进一步分析表明,CatBoost 模型在不同灌溉水平和生长阶段的预测一致性表现出显著差异。在低灌溉条件下(I?),模型预测一致性较高,这可能与较低的冠层覆盖度有关,使得无人机遥感数据能够更全面地捕捉整个作物群体的反射信息。而在高灌溉条件下(I?),由于冠层覆盖度较高,叶片之间的重叠和遮挡效应增强,导致遥感信号的混合更加复杂,降低了模型对水分胁迫特征的提取能力。此外,充足的水分供应使得冠层温度主要由气象因素(如风速、湿度和太阳辐射)主导,从而削弱了热红外特征与根区土壤水分之间的关联性。

从生长阶段的角度来看,模型预测一致性在开花期较低,而在铃开放期显著提高。这可能与土壤水分的逐步耗尽有关,当土壤水分含量下降时,作物的水分胁迫策略从“局部、动态水分吸收”逐渐转变为“整体、系统性水分胁迫”。这种转变使得冠层表现出高度同步的生理响应,如气孔导度下降、冠层温度系统性上升以及光谱特征的一致性变化。这种同步性简化了“冠层-土壤”系统中的信号关系,使得无人机获取的冠层遥感特征与根区水分含量之间的映射更加清晰和稳定。因此,在铃形成和铃开放阶段,CatBoost 模型不仅整体一致性较高,而且在不同土壤层中表现稳定,误差波动较小。

在不同土壤层的估算能力方面,CatBoost 模型在0–20厘米深度表现出最佳性能,而在更深层(如60厘米)则相对弱化。这可能与植被指数对深层土壤水分的敏感性较低有关,同时深层水分变化的滞后效应也增加了模型的预测难度。因此,模型在不同土壤层的估算精度存在差异,这提示我们需在模型训练和特征选择时充分考虑不同深度的响应特性。

本研究的成果表明,通过多维遥感指数与机器学习技术的结合,可以显著提升土壤水分含量的估算精度。同时,CatBoost 模型在多个关键指标上均表现出卓越的性能,显示出其在处理复杂非线性关系和多源数据融合方面的强大能力。这些发现不仅为棉花种植中的精准灌溉提供了理论和技术支持,也为其他作物的水分监测和管理提供了借鉴。未来研究可进一步探索如何将这些模型应用于更广泛的区域和作物类型,尤其是在跨区域和跨作物的场景下,通过引入迁移学习技术,提升模型的泛化能力和适用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号