堆叠集成学习与多源遥感数据的结合:提高大麦种植盐碱化土壤中土壤盐度反演的准确性
《Agricultural Water Management》:Stacking ensemble learning coupled with multi-source remote sensing data: Enhancing soil salinity inversion accuracy in barley-cultivated salinized soils
【字体:
大
中
小
】
时间:2025年11月06日
来源:Agricultural Water Management 6.5
编辑推荐:
本研究利用多源无人机遥感数据融合与集成学习优化土壤盐渍化估算模型,通过随机森林-递归特征消除(RF-RFE)筛选出RGB、MS、TIR最优特征子集,构建了七种数据融合方案和四种单模型及三种集成策略。结果表明,极端学习机(ELM)在表层土壤(R2=0.75)和高斯过程回归(GPR)在根层土壤(R2=0.73)表现最佳;两阶段堆叠集成(St-RR)模型通过ridge回归优化,分别使表层和根层土壤盐渍化估算精度提升6.0%-7.6%和6.1%-9.4%,RMSE降低5.1%-6.3%和8.3%-10.6%。RGB与MS数据融合结合St-RR模型达到最优性能,而TIR数据融合未显著提升精度。
土壤盐碱化对可耕地质量、作物生长和区域生物多样性构成了日益严重的威胁。因此,获取准确且高效的盐分信息对于盐碱地的治理至关重要。以往的研究主要集中在单一数据源或算法上,而将多源遥感数据与多种机器学习模型结合的潜力尚未得到充分探索。本研究在 barley(大麦)种植的土壤盐分梯度区域进行了定量实验,获取了可见光(RGB)、多光谱(MS)和热红外(TIR)影像,以及土壤剖面的表观电导率测量值。从遥感影像中提取了144个特征变量,包括波段亮度、光谱反射率和衍生的颜色指数、温度指数及纹理特征,通过随机森林重要性与递归特征消除(RF-RFE)协同方法进行筛选和优化,并将其纳入七种数据融合方案。同时,系统地建立了四种机器学习模型和三种集成学习策略(平均、加权、以及以岭回归为元模型的两层堆叠集成(St-RR)),使用五折交叉验证和多种评估指标进行评估。结果表明,极端学习机(ELM)在表层土壤中取得了最高的准确性(R2=0.75,RMSE=0.69%,MAE=0.45,RPIQ=0.76,RPD=1.98),而高斯过程回归(GPR)在根系区域土壤中表现最佳(R2=0.73,RMSE=1.06%,MAE=0.68,RPIQ=1.08,RPD=1.93)。所有三种集成学习策略均提升了估计精度,其中 St-RR 的提升最为显著(表层土壤:R2 增加 6.0%–7.6%,RMSE 减少 5.1%–6.3%;根系区域土壤:R2 增加 6.1%–9.4%,RMSE 减少 8.3%–10.6%)。在所有数据融合方案中,基于 RGB+MS 融合的 St-RR 模型在表层土壤(R2=0.76,RMSE=0.67%,MAE=0.43,RPIQ=0.79,RPD=2.04)和根系区域土壤(R2=0.77,RMSE=0.99%,MAE=0.65,RPIQ=1.16,RPD=2.08)中均取得了最高精度。总体而言,这些发现表明,结合多源遥感数据融合与堆叠集成学习的方法在土壤盐分估计中具有显著效果,为在细尺度上管理土壤盐碱化提供了坚实的技 术支持。
土壤盐碱化对作物根系吸水能力造成严重损害,并逐步破坏土壤结构,进而降低农田质量,减少作物产量,对作物生长和区域生物多样性构成重大威胁。全球范围内,约有 4.24 亿公顷的表层土壤(0–30 cm)和 8.33 亿公顷的亚表层土壤(30–100 cm)受到盐碱化影响。盐碱化是自然过程和人类活动共同作用的结果,近年来盐胁迫的强度不断加剧,使得及时且准确的土壤盐分信息对于有效治理至关重要。传统的监测方法由于其高劳动强度、耗时且成本高昂,限制了其在大范围空间和时间尺度上的应用。而遥感技术具有广泛的覆盖能力和快速的数据获取能力,为土壤盐分监测提供了有力支持。特别是基于无人机(UAV)的遥感技术,由于其高空间分辨率和操作灵活性,显著提高了盐分估计的准确性和效率,从而促进了区域盐碱化监测的发展。
近年来,基于 UAV 的遥感技术在土壤盐碱化监测中主要集中在利用单一数据源的光谱特征构建倒推模型。主要数据源包括可见光(RGB)传感器,从中通常提取作物生长参数(如植株高度、冠层覆盖率)、亮度值(R、G、B)和冠层纹理特征;多光谱(MS)传感器提供近红外和红边波段,可用于构建与盐分敏感相关的指数;热红外(TIR)传感器则捕捉盐胁迫引起的冠层温度响应。然而,表面物体的光谱信息容易受到植被覆盖和环境条件的干扰,这可能影响倒推模型的可靠性。虽然将单一传感器的敏感波段、光谱指数和纹理特征结合可以提高倒推性能,但其固有局限性仍然存在。例如,RGB 传感器提供高空间分辨率和有效的颜色解释能力,可以细粒度地捕捉植被冠层的可见反射率,但受限于红、绿、蓝波段,缺乏对近红外、红边和短波红外波段的敏感性,而这些波段对于检测盐胁迫至关重要。相比之下,MS 影像提供了这些额外的波段,对于监测叶绿素含量、水分和盐分吸收具有关键作用,但其较低的空间分辨率限制了对细微冠层变化的检测。TIR 数据反映了冠层蒸腾、土壤湿度和盐胁迫的热响应,但受到太阳辐射和环境温度波动的强烈影响。大多数研究集中在单一数据源的盐分估计模型上,而将 RGB、MS 和 TIR 数据在原始值、光谱指数和纹理水平上进行多源融合,可以弥补其各自的局限性。然而,这种多源融合在土壤盐分估计中的潜力仍需系统分析和验证。
多源遥感数据集虽然能丰富光谱信息,但同时也会生成高维度的特征。直接将所有高维度特征输入模型可能会因噪声传播和特征冗余而降低预测准确性,因此对特征提取和处理能力提出了更高要求。常用的特征提取方法包括基于滤波器的方法(如皮尔逊相关系数、卡方检验)、基于包装的方法(如递归特征消除(RFE)、前向/后向选择)以及嵌入式方法(如 Lasso、弹性网络正则化)等。滤波器方法虽然快速且易于实施,但通常仅考虑单个特征与目标变量之间的线性关系,忽视了复杂交互和非线性关系,可能忽略了多源数据中的重要信息。嵌入式方法通过正则化将特征选择纳入模型训练,这在计算效率和预测性能之间实现了平衡,但其对超参数高度敏感,处理高维度多源数据时容易陷入局部最优。相比之下,包装方法通过模型性能迭代选择特征,能更好地捕捉非线性和交互效应。例如,将随机森林(RF)特征重要性与 RFE 结合,可以识别非线性关系和交互效应,同时减少维度,为土壤盐分倒推提供更稳健的输入集。单一方法提取特征往往忽视了特征间的交互作用,而结合多种策略可以弥补其各自的局限性,增强变量代表性,提高模型的稳健性,从而提升土壤盐分估计的准确性和稳定性。
除了优化特征工程,模型选择对于提高基于遥感的土壤盐分估计的准确性与泛化能力同样至关重要。早期方法主要利用裸土影像中的可见光和近红外波段构建与实测土壤盐分相关的盐分指数。然而,这种方法对土壤属性(如水分、有机质)、表面粗糙度和颜色以及植被覆盖具有敏感性,这些因素会降低反射率并导致显著误差。在盐胁迫下,植被的生理参数(如冠层覆盖、植株高度、叶面积指数)以及光谱反射率和热特性会发生显著变化,从而产生独特的光谱响应模式。研究人员因此提取冠层光谱反射率,构建植被、盐分和温度指数,开发统计回归模型进行间接土壤盐分估计。然而,传统回归方法在捕捉特征变量与土壤盐分之间的复杂非线性关系方面存在固有局限。随着计算技术的快速发展,能够处理非线性关系的机器学习算法成为这一研究领域的重要研究方向。高斯过程回归(GPR)、支持向量机(SVM)、反向传播神经网络(BPNN)、极端学习机(ELM)以及随机森林(RF)等多源光谱特征被用于土壤盐分估计。值得注意的是,基于 UAV 的模型表现出显著的时空异质性:Xiang 等(2023)观察到,在植被覆盖条件下,结合四种光谱和纹理变量的 ELM 模型,无论是否去除土壤背景,均在表层土壤中表现出最优性能。相比之下,Zhang 等(2020)报告了在 GF-1 影像中,部分最小二乘法回归(PLSR)、Cubist 和 ELM 模型在植被覆盖下的性能变化,其中 Cubist 表现最佳,ELM 次之,而 PLSR 最差;BPNN、RF 和 SVM 也表现出类似的性能波动(Liu 等,2019;Naimi 等,2021;Zhang 等,2023)。这些发现表明,即使表现良好的模型也可能无法推广到具有不同土壤属性、植被组成或气候条件的区域,这可能归因于单一模型回归在训练数据有限时的过拟合现象(Wang 等,2023)。将多个机器学习预测结果进行集成可以部分缓解单一模型的偏差(Mahmoud 等,2025)。
集成学习,即通过整合多个基础学习器的预测输出,利用数据来源、模型参数和结构的多样性来合成互补信息,从而生成更稳健和准确的最终模型,提升预测精度。其性能不仅取决于基础学习器的多样性,还取决于训练框架(如装袋、提升、堆叠)和组合策略(如投票、简单平均或加权平均);适当设计的基础模型和组合策略可以显著增强泛化能力和预测性能。集成学习已被广泛应用于监测土壤理化性质:Dong 和 Tian(2024)使用 RF 和 BPNN 构建了堆叠集成模型进行土壤盐分估计;Shi 等(2025)通过加权平均融合卷积神经网络(CNN)、长短期记忆(LSTM)和人工神经网络(ANN)的预测结果,以达到相同目的;Taghizadeh-Mehrjardi 等(2020)则采用堆叠方法进行土壤有机质估计。这些研究共同表明,堆叠集成模型在性能上优于单一模型。然而,基于 UAV 多源光谱特征构建集成学习模型的系统研究仍较为有限。
本研究设计了七种基于 RGB、MS 和 TIR 多源光谱特征的数据融合方案,以评估单一机器学习模型(GPR、SVM、反向传播训练的多层感知机(BP-MLP)和 ELM)和三种集成策略(算术平均(Average)、加权平均(Weighted)以及以岭回归(RR)为元模型的两层堆叠集成(St-RR)在 barley 栽培条件下不同深度土壤盐分估计的性能。基于准确性和稳定性指标,提出了最优的估计方法。研究目标如下:(1)评估 RF-RFE 在特征选择中的解释力,揭示所选特征与目标变量的相关性和信息贡献,并验证这些特征是否充分反映了其与土壤盐分的内在关系;(2)分析和比较单一模型与集成策略在植被覆盖下不同深度土壤盐分估计的性能;(3)探讨将多源数据融合与集成学习结合在不同深度土壤盐分估计中的潜力。
在本研究中,为了确保建模和测试集保留整体样本分布的统计特性,采用了基于目标变量(土壤盐分)等频分箱的分层保留方法。对于表层土壤(0–10 cm)和根系区域土壤(10–40 cm),每个土壤层提取了 180 个土壤盐分样本,将其划分为 70% 用于训练和 30% 用于测试,分别得到 126 个训练样本和 54 个测试样本。研究构建了 GPR、SVM、BP-MLP 和 ELM 模型,并基于 Wolpert(1992)提出的堆叠回归概念,开发了基于两层结构的堆叠回归框架以提高预测准确性。此外,还设计了两种简单的集成策略(加权平均和算术平均),共构建了三种集成模型框架,用于检验单一模型与集成学习模型在预测精度上的差异。模型训练采用嵌套交叉验证(外层五折,内层十折)结合贝叶斯优化进行自动超参数调优。在外层每个折叠中,训练集被随机且均匀地划分为五个子集,其中四个子集用于训练,一个用于验证,并重复五次,使所有样本都参与训练和验证。在每个外层折叠中,采用内层十折交叉验证以确定最小化均方误差的超参数集。然后,将最优参数应用于外层训练子集重新训练模型,生成外样本预测。嵌套交叉验证方案被采用以避免调优过程中的信息泄露,并提供更可靠的泛化性能估计。在第二阶段,根据选定的集成策略,将四个基础学习器的预测结果组合以生成最终输出。对于堆叠集成(St-RR),基础学习器在训练集上的外折预测被列成列,作为岭回归(RR)元学习器的输入特征;然后,将基础学习器在测试集上的预测结果输入到训练好的 RR 元学习器中,以获得最终预测(直观地,堆叠将基础模型预测视为新特征,并让元学习器学习如何最佳地加权和修正这些预测)。对于加权平均策略(Weighted),每个基础学习器的权重与其在训练集上的均方根误差(RMSE)成反比(即表现更好的模型获得更大的权重),最终预测通过加权求和得到。相比之下,算术平均策略(Average)使用四个基础学习器预测结果的算术平均作为最终输出。这些配置被用于系统评估个体模型和集成策略在土壤盐分倒推任务中的相对性能。图 2 展示了本研究中开发的土壤盐分预测框架的整体工作流程,该框架结合了多源遥感特征融合和集成学习。工作流程主要包括特征提取和集成模型框架的构建。步骤 1 展示了从三种遥感数据中进行预处理、特征提取、特征选择和光谱特征组合。步骤 2 展示了四个基础模型(GPR、SVM、BP-MLP 和 ELM)的训练过程。步骤 3 对应三种集成模型框架的构建。具体而言,从 RGB、MS 和 TIR 数据源中提取了亮度、反射率、辐射亮度、颜色指数、光谱指数、温度指数以及波段纹理特征。使用 RF-RFE 算法对每个数据源分别进行特征选择,并将所选特征重新组合形成七种数据方案。样本被划分为 70% 的训练集和 30% 的测试集。基础模型使用嵌套交叉验证(外层五折,内层十折)进行训练,并将它们在训练和测试集上的预测结果作为输入,输入到 RR、Weighted 和 Average 中构建最终模型。
为了确保透明性和可比性,模型性能通过多种互补指标进行评估,包括决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)、预测性能与四分位间距比(RPIQ)以及预测性能与偏差比(RPD)。R2 和 RPD 用于评估整体预测能力,而 RPIQ 则提供了对观察值中心 50% 的保守精度测量,这对于偏态分布的数据尤其相关。较高的 R2、RPIQ 和 RPD 值,以及较低的 RMSE 和 MAE,表明预测性能更好。根据之前研究中土壤属性预测(尤其是土壤盐分)的标准,R2 > 0.7 且 RPD > 2.0 表示良好性能,而 R2 > 0.8 且 RPD > 2.5 表示优秀性能(Mustafa 等,2024)。五个指标的计算公式如下:
R2 = 1 - ∑(?_i - y_i)^2 / ∑(y_i - y?)^2
RMSE = √[∑(?_i - y_i)^2 / n]
MAE = (1/n) ∑|y_i - ?_i|
RPIQ = IQR / RMSE
RPD = SD / RMSE
其中,y_i 表示观测值,?_i 表示预测值,IQR(IQR = Q3 - Q1)表示观测值的四分位间距,Q3 和 Q1 分别代表第 75% 和第 25% 百分位数,SD 表示 y 的标准差。
本研究的实验场地设在扬州大学生态水文实验站,位于江苏省扬州市,地理坐标为 32°21′N、119°24′E,海拔 5 米(图 1)。实验田位于江淮平原,具有湿润亚热带季风气候,年均温 14.8°C,年均降水量 1063 毫米,年均蒸发量 937 毫米。实验设置了四种定量土壤盐分处理:非盐化、轻度盐化(3‰)、中度盐化(5‰)和重度盐化(10‰),每种处理重复三次,共形成 12 个试验小区。大麦于 10 月下旬播种,5 月下旬收获,持续两个生长季。为了防止与周围土壤的水分和盐分交换,作物种植在封闭的弯道盒(100 cm × 40 cm × 40 cm)中进行,确保处理的一致性。整个生长期内,按照高产栽培模式进行田间管理。
在本研究中,通过无人机平台采集了高分辨率的光谱和空间数据。使用 DJI Inspire 2 平台,配备了 MicaSense Altum 多光谱-热红外相机和 Zenmuse X5S RGB 相机。影像在作物生长季节的每月初、中、末期采集,确保天气晴朗、风速较低(当地时间 11:00–14:00)。MicaSense Altum 传感器在飞行前预热 5 分钟,并使用参考面板进行辐射校准。飞行高度为 25 米,前向重叠率为 75%,俯视方向,获得 1.4 cm/像素的地面采样距离(GSD)。Zenmuse X5S 相机在飞行前 1–3 分钟开启,使用参考面板进行校准,飞行高度为 62 米(15 mm 镜头),前向重叠率 75%,俯视方向,目标 GSD 为 0.8 cm/像素。每次飞行后,影像进行拼接、辐射和色彩校准、几何正射校正,并与相同分辨率进行配准和重采样,生成最终的正射影像图。
为了确保建模和测试集保留整体样本分布的统计特性,采用了基于目标变量(土壤盐分)等频分箱的分层保留方法。对于表层土壤(0–10 cm)和根系区域土壤(10–40 cm),各提取了 180 个土壤盐分样本,将其划分为 70% 用于训练和 30% 用于测试,分别得到 126 个训练样本和 54 个测试样本。研究构建了 GPR、SVM、BP-MLP 和 ELM 模型,并基于 Wolpert(1992)提出的堆叠回归概念,开发了基于两层结构的堆叠回归框架以提高预测准确性。此外,还设计了两种简单的集成策略(加权平均和算术平均),共构建了三种集成模型框架,用于检验单一模型与集成学习模型在预测精度上的差异。模型训练采用嵌套交叉验证(外层五折,内层十折)结合贝叶斯优化进行自动超参数调优。在每个外层折叠中,训练集被随机且均匀地划分为五个子集,其中四个子集用于训练,一个用于验证,并重复五次,使所有样本都参与训练和验证。在每个外层折叠中,采用内层十折交叉验证以确定最小化均方误差的超参数集。然后,将最优参数应用于外层训练子集重新训练模型,生成外样本预测。嵌套交叉验证方案被采用以避免调优过程中的信息泄露,并提供更可靠的泛化性能估计。在第二阶段,根据选定的集成策略,将四个基础学习器的预测结果组合以生成最终输出。对于堆叠集成(St-RR),基础学习器在训练集上的外折预测被列成列,作为岭回归(RR)元学习器的输入特征;然后,将基础学习器在测试集上的预测结果输入到训练好的 RR 元学习器中,以获得最终预测(直观地,堆叠将基础模型预测视为新特征,并让元学习器学习如何最佳地加权和修正这些预测)。对于加权平均策略(Weighted),每个基础学习器的权重与其在训练集上的均方根误差(RMSE)成反比(即表现更好的模型获得更大的权重),最终预测通过加权求和得到。相比之下,算术平均策略(Average)使用四个基础学习器预测结果的算术平均作为最终输出。这些配置被用于系统评估个体模型和集成策略在土壤盐分倒推任务中的相对性能。图 2 展示了本研究中开发的土壤盐分预测框架的整体工作流程,该框架结合了多源遥感特征融合和集成学习。工作流程主要包括特征提取和集成模型框架的构建。步骤 1 展示了从三种遥感数据中进行预处理、特征提取、特征选择和光谱特征组合。步骤 2 展示了四个基础模型(GPR、SVM、BP-MLP 和 ELM)的训练过程。步骤 3 对应三种集成模型框架的构建。具体而言,从 RGB、MS 和 TIR 数据源中提取了亮度、反射率、辐射亮度、颜色指数、光谱指数、温度指数以及波段纹理特征。使用 RF-RFE 算法对每个数据源分别进行特征选择,并将所选特征重新组合形成七种数据方案。样本被划分为 70% 的训练集和 30% 的测试集。基础模型使用嵌套交叉验证(外层五折,内层十折)进行训练,并将它们在训练和测试集上的预测结果作为输入,输入到 RR、Weighted 和 Average 中构建最终模型。
通过 RF-RFE 方法对三种特征(RGB、MS、TIR)在表层土壤和根系区域土壤中的特征选择结果表明,特征选择显著减少了特征数量。表层土壤保留了 21、16 和 5 个特征,而根系区域土壤保留了 9、17 和 5 个特征。为了保持在不同深度上的一致性,仅保留两个层中都选中的特征:RGB(如 GBD、CC、9 个特征)、MS(如 DVI-reg、NIR、S2、16 个特征)和 TIR(如 NRCT、TVDI、4 个特征)。因此,构建了七种特征集(RGB、MS、TIR、RGB+MS、RGB+TIR、MS+TIR、RGB+MS+TIR;见表 2)。所选特征包括波段反射率、辐射亮度、光谱指数和纹理,具有高重要性和显著影响,证明了基于 RF-RFE 的特征选择在盐分估计中的实际潜力。
在本研究中,七种数据融合方案涵盖了所有可行的组合,同时避免了冗余配置,从而便于评估不同数据组合方案对土壤盐分倒推模型的影响。单一源方案(RGB、MS、TIR)作为性能基准,用于独立评估每种数据类型的效力;双源融合方案(RGB+MS、RGB+TIR、MS+TIR)用于考察不同源之间的互补性及其对倒推性能的影响;而三源融合(RGB+MS+TIR)用于评估将所有三种源融合是否能带来进一步的性能提升。这些七种方案覆盖了所有可行的组合,同时避免了冗余配置,从而便于评估不同数据组合方案对土壤盐分倒推模型的影响。
通过比较不同机器学习模型在不同数据集上的表现,发现 ELM 在表层土壤中表现最佳(R2=0.75,RMSE=0.69%,MAE=0.45,RPIQ=0.76,RPD=1.98),而 GPR 在根系区域土壤中表现最佳(R2=0.73,RMSE=1.06%,MAE=0.68,RPIQ=1.08,RPD=1.93)。此外,所有三种集成学习策略均提高了估计精度,其中 St-RR 的提升最为显著。对于表层土壤,St-RR 提升了 R2 的平均值 6.0%–7.6%,降低了 RMSE 的平均值 5.1%–6.3%;对于根系区域土壤,St-RR 提升了 R2 的平均值 6.1%–9.4%,降低了 RMSE 的平均值 8.3%–10.6%。在所有数据融合方案中,基于 RGB+MS 融合的 St-RR 模型在表层土壤和根系区域土壤中均取得了最高精度。这表明,多源遥感数据融合结合集成学习在 barley 栽培区域的土壤盐分估计中具有显著效果。
进一步的分析表明,多源数据融合对盐分估计的有效性取决于组合方式。例如,RGB+MS 融合显著优于单一源数据集,而加入 TIR 的融合(RGB+TIR、MS+TIR)并未显著提高模型性能,甚至在某些情况下略微降低了精度。将 TIR 加入 RGB+MS 集合(RGB+MS+TIR)则略微降低了准确性。这表明,RGB 和 MS 的融合提供了更有效的特征组合,而 TIR 的加入未能带来显著提升,可能与其对冠层和地表温度的敏感性有关,这些温度数据容易受到蒸腾、光照、风速和冠层结构等环境因素的影响,从而削弱了其对盐分胁迫的直接检测能力。因此,尽管 TIR 数据在某些情况下具有潜力,但在土壤盐分估计中其作用有限。
总体而言,基于 UAV 的多源遥感数据结合集成学习显著提高了 barley 栽培区域土壤盐分倒推的准确性。这一成果不仅为盐碱地的精细管理提供了技术支撑,也为可持续的耕地利用提供了科学依据。同时,该研究也揭示了不同数据源和模型组合在土壤盐分估计中的不同表现,为未来的研究提供了重要的参考。此外,研究还强调了特征选择在提高模型性能中的关键作用,表明通过有效的特征筛选,可以显著提升模型的准确性与稳定性。这些发现对遥感技术在农业和环境监测中的应用具有重要意义,也为未来在更大范围和更多作物类型中的推广提供了基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号