直接和间接数字土壤制图方法对空间不确定性的影响

《Geoderma》:The impact of direct and indirect digital soil mapping approaches on spatial uncertainty

【字体: 时间:2025年07月24日 来源:Geoderma 6.6

编辑推荐:

  该研究通过机器学习和多变量地统计学方法,比较了直接与间接土壤有机碳(SOC)制图方法在匈牙利大平原上的不确定性量化与传播效果。结果表明,不同推理轨迹和假设显著影响不确定性估计,尤其在空间聚合时需考虑误差的空间自相关和交叉相关。建议在DSM中更关注方法学假设和误差来源的贡献分析,以提升预测可靠性。

  在数字土壤制图(DSM)领域,已有大量研究对比了不同的制图方法(或推理轨迹),但对这些方法如何影响不确定性量化和传播的关注较少。本研究的目的是探讨与不确定性量化和传播相关的关键问题,这些问题可能影响DSM产品在实际应用中的适用性。其中包括:不同的制图方法和DSM中所做的假设如何影响不确定性量化和传播?从不确定性角度来看,这些制图方法有哪些优缺点?这些问题通过以匈牙利的匈牙利大平原为例,结合机器学习与单变量和多变量地统计学方法进行探讨。研究分为两个案例:在案例1中,目标是使用直接和间接制图方法对2016年的土壤有机碳(SOC)储量进行制图,并量化和比较不同空间聚合水平下的预测不确定性。案例2的目标相似,但侧重于1992年至2016年间SOC储量变化的制图。研究中应用了多种推理轨迹(如“先计算后建模”和“先建模后计算”),不同的数据预处理方法(如平方根变换和标准归一化)以及不确定性传播技术(如泰勒方法和解析解),并从预测精度(如均方误差、均值误差)和不确定性(如预测区间覆盖率概率图、区间评分)两个角度进行比较。

研究结果表明,所选的推理轨迹和DSM中的假设对不确定性估计有显著影响,不仅在点支持上,而且在更大的支持尺度上也是如此。研究还强调了在进行不确定性传播时考虑插值误差相关性的重要性。此外,本研究指出,识别和量化不同误差源对不确定性传播的贡献是减少特定土壤属性或功能相关总体不确定性的关键。

数字土壤制图旨在提供土壤属性和功能在空间和日益增长的时空变异性方面的信息。空间土壤信息在土壤健康监测与评估、可持续农业、农村发展、景观与自然保护等方面被广泛认可为必不可少。此外,土壤在应对环境挑战和危机方面也发挥着重要作用,包括缓解气候变化、实现土地退化中性、维持陆地生态系统、生产健康营养的食物、确保清洁饮用水以及保护健康的环境。

研究强调,任何地图都不可能是完全无误差的,DSM生成的地图也不例外。事实上,各种误差可能在不同阶段产生,从采样策略的设计和土壤样本的采集,到开发预测DSM模型和发布最终地图。多年来,许多影响DSM产品质量和可靠性的误差源已被调查,包括采样误差(如Brus等人,1999;Hofman和Brus,2021)、实验室测量误差(如Takoutsing和Heuvelink,2022;van Leeuwen等人,2022)以及插值误差(如Szatmári和Pásztor,2019;Vaysse和Lagacherie,2017)。在DSM中,误差被定义为预测值与真实值之间的差异。显然,由于无法在所有位置获得真实值,误差无法完全知晓(如Heuvelink,2014;Heuvelink,2018)。不确定性则反映了我们意识到预测可能偏离真实值的程度,尽管这种偏离的具体大小是未知的。通常,采用概率方法来建模和量化不确定性,将真实值视为随机变量的一个实现。该随机变量的累积分布函数是不确定性的一个完整描述,实际上是一个模型,因为它给出了真实值不超过任何给定阈值的概率(如Goovaerts,2001)。

不确定性量化至关重要,因为它旨在用数字方式表达我们对描述和表征对象、过程或属性的不完美知识(如Bárdossy和Fodor,2004)。此外,包括其他学科的研究者、从业者、利益相关方、决策者和甚至普通公众在内的终端用户对这类信息越来越感兴趣。理想情况下,DSM产品作为农业、气候、水文等模型以及空间决策支持系统的输入,这种应用通常需要对输入的可靠性进行定量信息,以判断输入是否足够准确用于决策,或者评估输入的不确定性如何通过模型或决策系统传播并影响输出。尽管学者们已经付出了显著努力以更好地理解不确定性,这些努力体现在有影响力的书籍(如Goovaerts,1997;Heuvelink,1998;Webster和Oliver,2007)、综述(如Goovaerts,2001;Goovaerts,1999;Heuvelink和Webster,2022;Heuvelink和Webster,2001)以及研究论文(如Kasraei等人,2021;Schmidinger和Heuvelink,2023;Szatmári等人,2024;Szatmári等人,2021;Szatmári和Pásztor,2019;Vaysse和Lagacherie,2017;Wadoux,2019;Wadoux和Heuvelink,2023)中,但仍有必要进一步推进以加深对不确定性的理解,并在DSM中进行管理,有效地向终端用户传达,并减少不确定性以支持信息决策。

终端用户对难以测量或成本高昂的土壤属性和功能(如SOC储量、可用水分容量和缓冲能力)日益感兴趣。因此,可以更容易和/或更经济地测量的主要土壤属性(如SOC含量、pH和容重)常被用于推导这些属性或功能。在制图衍生土壤属性或功能时,DSM中通常采用两种通用方法:直接制图和间接制图。在直接制图中,通常被称为“先计算后插值”(Heuvelink和Pebesma,1999)或“计算后建模”(Orton等人,2014),首先使用主要土壤属性在土壤观测水平上计算次级土壤属性的值,然后使用这些计算值进行次级土壤属性的制图。而在间接制图中,通常被称为“先插值后计算”(Heuvelink和Pebesma,1999)或“建模后计算”(Orton等人,2014),首先对次级土壤属性所需的主要土壤属性进行制图,然后使用这些地图推导次级土壤属性的地图。许多论文(如Chen等人,2023;Heuvelink和Pebesma,1999;Miller等人,2015;Pásztor等人,2017;Szabó等人,2019)已经评估和比较了这两种方法。需要注意的是,案例2A不能明确归类为直接或间接制图,而是代表了一种“计算-制图-计算”的方法。然而,这种方法常用于SOC变化的制图(如Schillaci等人,2017;Szatmári等人,2021;Szatmári等人,2019;Zhou等人,2019),因为终端用户通常不仅关注特定时间段内的SOC储量变化,还关注该时间段内的实际SOC储量。

在案例2A中,首先在土壤剖面水平上计算SOC储量值,然后使用这些值对1992年和2016年的SOC储量进行制图。所采用的模型反映了空间变化,其中包含了误差的不确定性传播。此外,研究中还比较了不同方法在预测精度和不确定性方面的表现。例如,案例2B中的不确定性传播基于SOC储量变化的公式,其中涉及多个误差源,包括SOC储量和BD的不确定性,以及它们之间的协方差。这些不确定性传播技术通过计算和比较不同方法在预测精度和不确定性方面的表现进行评估。

研究结果表明,所选的推理轨迹和DSM中的假设显著影响不确定性估计,不仅在点支持上,而且在更大的支持上。此外,研究强调了在进行不确定性传播时考虑插值误差相关性的必要性。更重要的是,本研究强调了识别和量化不同误差源对不确定性传播的贡献的重要性,因为这可能是减少特定土壤属性或功能相关总体不确定性的关键。

在本研究中,应用了多种推理轨迹(如“先计算后建模”和“先建模后计算”)、数据预处理方法(如平方根变换和标准归一化)以及不确定性传播技术(如泰勒方法和解析解)。这些方法在预测精度(如均方误差、均值误差)和不确定性(如预测区间覆盖率概率图、区间评分)两个方面进行了比较。研究结果表明,不同的推理轨迹和假设对不确定性估计有显著影响,不仅在点支持上,而且在更大的支持上。因此,这可能对DSM产品的适用性产生决定性影响。

本研究的案例涵盖了SOC储量和SOC储量变化的制图,通过结合机器学习和多变量地统计学方法进行分析。案例1中,采用直接和间接制图方法对2016年的SOC储量进行制图,并量化和比较不同空间聚合水平下的预测不确定性。案例2中,目标相似,但聚焦于1992年至2016年间SOC储量变化的制图,并在多个聚合水平上进行比较。研究旨在探讨以下几个问题:不同的制图方法和推理轨迹如何影响不确定性量化的结果?在DSM中,关于不确定性的量化或传播所做的假设和方法论决策如何影响结果?这些问题是当前研究中关注较少的,但它们可能对不确定性估计的可靠性产生重大影响。

研究强调了不确定性传播中考虑插值误差相关性的重要性。在进行不确定性传播时,插值误差的自相关和互相关必须被考虑。因此,需要识别和量化不同误差源对不确定性传播的贡献,这可能是减少特定土壤属性或功能相关总体不确定性的关键。此外,本研究还指出了在进行不确定性传播时,一些关键方法论问题,如数据预处理方法的选择和不确定性传播技术的应用,这些因素对不确定性估计的可靠性有重要影响。

在进行不确定性传播时,除了考虑插值误差的相关性外,还需要考虑其他误差源的影响。例如,数据变换的选择、模型参数的设定以及不确定性传播方法的采用,都会对最终的不确定性估计产生影响。这些因素需要被仔细考虑和评估,以确保不确定性估计的准确性和可靠性。研究还指出了在进行不确定性传播时,一些潜在的方法论问题,如如何处理不同误差源之间的相互作用,以及如何在不同的空间尺度上进行不确定性量化和传播。

本研究通过匈牙利大平原的案例,探讨了直接和间接制图方法对SOC储量和SOC储量变化不确定性估计的影响。研究结果表明,不同的制图方法和推理轨迹可以导致显著不同的不确定性估计,不仅在点支持上,而且在更大的支持上。因此,这些方法可能对DSM产品在模型(如农业、水文和气候模型)和空间决策支持系统中的适用性产生决定性影响。此外,研究还指出了在进行不确定性量化时,需要考虑误差源之间的相互作用,以及如何通过数据变换和模型选择来优化不确定性估计。

在案例2A中,首先在土壤剖面水平上计算SOC储量值,然后使用这些值对1992年和2016年的SOC储量进行制图。研究中应用了多种不确定性传播技术,包括泰勒方法和解析解。这些方法在预测精度和不确定性估计方面进行了比较。案例2B中,使用了标准归一化变换,这有助于更准确地建模主要土壤属性之间的空间相互依赖性。研究还指出了在进行不确定性传播时,一些潜在的方法论问题,如如何处理不同误差源之间的相互作用,以及如何在不同的空间尺度上进行不确定性量化和传播。

研究还探讨了直接和间接制图方法在不确定性量化方面的优缺点。从不确定性角度来看,直接制图方法可能更简单,但间接制图方法可以提供更详细的不确定性传播分析。然而,间接制图方法可能涉及更多的计算和存储需求,以及更多的假设和决策。因此,研究强调了在进行不确定性量化时,需要仔细考虑这些因素,以确保最终结果的准确性和可靠性。此外,研究还指出了在进行不确定性传播时,一些潜在的方法论问题,如如何处理不同误差源之间的相互作用,以及如何在不同的空间尺度上进行不确定性量化和传播。

研究结果表明,不同的制图方法和推理轨迹对不确定性估计有显著影响,不仅在点支持上,而且在更大的支持上。因此,这可能对DSM产品的适用性产生决定性影响。此外,研究还指出了在进行不确定性量化时,需要考虑误差源之间的相互作用,以及如何通过数据变换和模型选择来优化不确定性估计。这些因素需要被仔细考虑和评估,以确保不确定性估计的准确性和可靠性。

在进行不确定性传播时,除了考虑插值误差的相关性外,还需要考虑其他误差源的影响。例如,数据变换的选择、模型参数的设定以及不确定性传播技术的应用,都会对最终的不确定性估计产生影响。这些因素需要被仔细考虑和评估,以确保不确定性估计的准确性和可靠性。研究还指出了在进行不确定性传播时,一些潜在的方法论问题,如如何处理不同误差源之间的相互作用,以及如何在不同的空间尺度上进行不确定性量化和传播。

研究结果表明,不同的制图方法和推理轨迹对不确定性估计有显著影响,不仅在点支持上,而且在更大的支持上。因此,这可能对DSM产品的适用性产生决定性影响。此外,研究还指出了在进行不确定性量化时,需要考虑误差源之间的相互作用,以及如何通过数据变换和模型选择来优化不确定性估计。这些因素需要被仔细考虑和评估,以确保不确定性估计的准确性和可靠性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号