综述:尺度在不确定性定义中的重要性:如何最好地向数据用户传达?

【字体: 时间:2025年10月10日 来源:SURVEYS IN GEOPHYSICS 7.1

编辑推荐:

  本综述系统探讨了地球观测数据(如海表温度(SST)、土壤湿度、二氧化碳(XCO2)在气候变化服务中的不确定性传递问题。文章强调不同误差成分(独立误差、结构化误差、共同误差)随空间/时间尺度变化的特性,提出通过数据生产者与用户的紧密协作,将高分辨率不确定性信息转化为适应决策场景的实用指标(如干旱赔付、极端事件回报期),为气候适应行动提供科学支撑。

  

引言

在利用遥感数据(或任何数值数据)得出有意义的结论时,用户需要了解数据提供者对其数据产品的置信程度,以及在该应用中可被信任的程度。在最基本的层面上,某个信息源是否适用于特定决策场景可能是最先被问到的问题。许多情况下,信息提供的合理范围是关键信息。这种数据置信水平对于帮助数据用户决定对其数据分析结果的适当响应至关重要。本文重点关注地球观测数据的使用,通常以长期气候数据记录(CDR)的形式,应用于气候服务和气候建模决策中。
气候服务是一个广义术语,涵盖了从单纯提供数据产品到具有特定决策场景的服务(用户理想情况下应参与共同开发服务)。在决策空间中,气候信息及其不确定性通常只是所需信息的一部分,很少有针对服务直接基于气候信息单独构建(尽管此类服务确实存在,例如非洲风险能力组织的干旱赔付)。因此,CDR可能会与气候模型预测(例如年度、季节或年代际预测)和预估(例如50-100年或更长时间尺度)以及非气候信息结合使用。CDR中的不确定性有助于将预测或未来气候预估中的不确定性置于背景中,或通过仔细比较来约束这些不确定性,例如在气候敏感性的情况下,改进的不确定性估计对于约束从观测中得出的气候敏感性估计至关重要。

不确定性随尺度变化的示例

海表温度(SST)

所有作为欧洲空间局(ESA)气候变化倡议(CCI)计划一部分生产的海表温度产品都包含逐数据点的不确定性。数据包括总不确定性及其分为三个不同组件的细分,这些组件以其相关长度尺度为特征:独立、结构化和共同。不确定性预算的独立部分在一个SST测量与下一个之间不相关,包括诸如仪器噪声等误差源。结构化组件涉及在天气尺度上相关的 uncertainties,源于SST反演中大气状态指定的误差。不确定性预算的共同部分在整个卫星任务期间完全相关,主要与仪器校准引起的误差有关。
在此示例中,我们使用海陆表面温度辐射计(SLSTR)的每日SST产品,分辨率为0.05°。每日数据在空间上不完整,原因有二:(1)卫星在24小时内无法实现全球全覆盖;(2)当云层遮挡地球表面时,无法进行SST反演。由于许多用户在其应用中需要更粗时空分辨率的产品,我们在此考虑随着我们在0.05°、0.1°、0.25°、0.5°、1.0°和2.0°的空间尺度上以及每日、5天、10天和28天平均的时间分辨率上平均数据时,独立、结构化和共同组件之间的不确定性分配如何变化。请注意,0.05°与每日配对是输入数据的原始分辨率。鉴于输入数据因覆盖不完整而具有“间隙”特性,缩放到更粗分辨率需要计算额外的采样不确定性,这构成了独立不确定性组件的附加部分。
40°N和<40°S的白天数据(g-i)">
在高空间分辨率下,不确定性的主要来源是独立组件。随着时空尺度的增加,不确定性的主要来源转向结构化组件,因为独立组件平均降低。输入数据的“间隙”性质对于确定结构化不确定性平均降低的速度非常重要。在夜间,由于SST的空间变异性减少,此特征缺失(图1)。在此处考虑的最大时空平均下,独立与结构化不确定性组件的比率发生转变,共同组件成为剩余不确定性的主要贡献者。

土壤湿度

遥感土壤湿度产品的不确定性评估通常侧重于在像元水平上估计独立不确定性。由于缺乏大范围绝对土壤湿度水平的参考数据,通常不量化常见不确定性(即偏差)。“独立”不确定性的估计通常是集中估计,不区分独立和结构化组件。误差在时间和空间上都已被发现存在相关性,需要在聚合像元级土壤湿度估计时考虑。在此示例中,我们演示了如何为不同的土壤湿度产品估计此类误差相关性,以及这些相关性在哪些时间和长度尺度上可能重要。
全球土壤湿度产品(及其他变量)的独立不确定性通常使用三重搭配分析(TCA)进行估计。此外,还提出了几种TCA的变体,不仅用于估计单个产品的随机误差方差,还用于估计产品之间的误差协方差以及时间和空间中的误差自协方差。这里我们使用这些TCA变体来推导两种常见卫星土壤湿度产品ASCAT和SMAP以及一个模拟数据集GLDAS-Noah的空间和时间误差相关长度尺度。
这些误差相关性的存在具有重要影响,特别是在土壤湿度估计在时间或空间上平均时。例如,在干旱研究中,通常查看10天或月平均值,或者在气候研究中,通常在比观测数据更粗的网格上工作(例如0.5°–1°)。平均土壤湿度估计也会减少其不确定性,但误差之间的相关性越大,这种不确定性减少的效率就越低。图3显示了在忽略误差相关性的理想化场景(虚线)和考虑图2中为ASCAT、SMAP和GLDAS估计的实际误差相关性的现实场景下,平均土壤湿度观测值时不确定性减少的比例。

二氧化碳(XCO2

此对柱平均干空气CO2摩尔分数(XCO2)反演不确定性在一系列空间和时间尺度上的分析基于对文献中可获得的核心不确定性贡献的自下而上评估。初步分析建立在日本宇宙航空研究开发机构(JAXA)温室气体观测卫星(GOSAT)任务XCO2产品的不确定性量化基础上,并辅以美国国家航空航天局(NASA)轨道碳观测站(OCO-2)任务的不确定性估计,特别是用于量化通过反演表征大气时前向模型误差。目前有多个XCO2产品正在生成,利用GOSAT、OCO-2或TanSat(有时称为CarbonSat)数据以及各种反演代码。因此,此处呈现的分析旨在详细说明名义XCO2产品的考虑因素,而不是针对一个特定业务产品,作者无意复制各自产品团队进行的详细分析。
空间和时间中的相关长度尺度已根据对不确定性组件和采样机制的理解进行了估计,并通常分类为 a) 独立 b) 结构化,存在短期相关性(通常在局部空间范围上比时间范围上更突出)或 c) 常见且持久。测量噪声在空间和时间维度上都被认为在逐像元水平上是独立的,后处理不确定性的大部分份额也是如此。不确定性贡献的常见类别由前向模型的元素主导,包括前向模型光谱学不确定性和先验误差,例如CO2、温度和气溶胶光学深度。
2产品总组合不确定性(ppm)随空间和时间尺度延长的典型变化">
不确定性行为相对较快地从独立主导的每像元峰值 above 5 ppm 下降到几百公里尺度及天气尺度以外约3.5 ppm的值。在更长的空间和时间尺度上,所有初始结构化效应都被视为独立的,并且行为渐近地由常见项主导。更全面地考虑采样不确定性和质量过滤测量的地理结构可能会增加总体不确定性,特别是在中等尺度(一周到几个月,以及几百公里)上,尤其是在季节性持续云量盛行的地区。

讨论

海表温度、土壤湿度和二氧化碳示例的关键信息

第2节中的三个示例说明,尽管一个共同的不确定性框架可以应用于多个ECV,例如考虑单个不确定性组件及相关相关性,但将不确定性传递到不同时空尺度的问题是有细微差别的。实际上,各种不确定性组件被认为重要的程度在ECV之间差异很大。在本文呈现的示例中:SST产品包含了最 rigorous 的尝试来量化所有可能误差源的所有不确定性;土壤湿度社区在将所有不确定性视为独立方面过于 optimistic;CO2社区在粗化数据分辨率时没有直接解决采样不确定性问题(尽管在区域尺度的反演方案中考虑了这一点)。
输入产品缩放的 key 因素将在一定程度上决定不同不确定性组件随尺度的比例。空间连续产品中的独立不确定性将随尺度迅速减少,而“有间隙”数据(如SST和XCO2案例)中的独立不确定性则因采样不确定性的增加而放大,特别是在较短的时空尺度上。量化这种方式将取决于传感器地面采样的特性。
起始产品的性质也将决定给定采样频率下可能或明智地进行聚合的时空长度尺度。对于SST示例,在2公里和28天的时空尺度上,采样频率使得覆盖率>50%难以实现。进一步扩大时空尺度将导致采样频率进一步降低,这可能取决于预期应用而不受欢迎。可以回答的科学问题也随尺度变化:通过大时空平均,诸如局部强降雨增加土壤湿度、CO2源的位置或SST的日变化的细节将会丢失。如果采样在某种程度上是系统性的,例如由于轨道特性或云覆盖,更频繁地对某个海洋盆地或陆地区域进行采样,这也可能影响所提出问题的 apparent 答案。
对于完全间隙填充的产品,可以计算更大尺度的平均值而无需添加采样不确定性,尽管如果数据本质上不连续,间隙填充过程可能会引入另一个不确定性源。应该注意的是,间隙填充的L4 SST和土壤湿度产品确实存在并包含不确定性信息(例如在SST示例中用作计算采样不确定性参考的产品),但在两种情况下,不确定性信息都没有直接从输入数据通过分析完全传递,因此存在不确定性可追溯性链的中断。
关于相关长度尺度的假设也将影响总不确定性预算,并且天真的独立性假设可能导致对 resulting 时空平均值的错误置信,如土壤湿度示例所示。虽然误差相关性通常被认为是一个“问题”,因为它们使观测对于平均或聚合目的 redundant,但它们确实为数据同化技术提供了跨空间或时间传播观测信息的机会:例如,如果位置x的观测表明位置x的模型预报太低,并且如果误差在空间上相关,那么这表明位置y的模型预报可能也太低。无论位置x和y的模拟或观测状态是否相关,这都是正确的。因此,位置x的单个观测可以帮助改进位置x和y的模型预报。这也意味着误差协方差使数据同化技术能够改进 entirely 未观测区域的模型模拟。然而,这种“二维滤波”需要可靠的模型模拟和观测的误差协方差估计,并且高估和低估的误差协方差(即“保守”猜测)可能会恶化模型技能而不是改进它。

为气候服务弥合数据生产者与用户之间的差距

从根本上说,数据对于特定决策场景的适用性是确保数据可用于服务的关键。这首先需要数据提供者对决策场景或服务的细致理解, coupled 对给定观测产品及其设计目的详细理解,然后才能 clearly 评估数据的适用性。每个不确定性组件都需要在所提出问题背景下仔细考虑:在每日、局部尺度上重要的内容可能对全球、年代际尺度应用不重要。由于地球观测数据的每个应用都需要与所提出问题相关的空间和时间分辨率信息,因此不确定性信息提供的灵活性对于允许其使用至关重要。从数据提供者的角度来看,先决条件是对不确定性源及其相互关系的全面映射。FIDUCEO项目开发的映射框架的传播是数据提供者努力满足此需求的一个 excellent 示例。
气候服务通常利用ECV数据的更大尺度时空平均,例如地方、地区或区域平均,或者 alternatively 衍生指数,例如极端事件指标。在受极端事件影响的决策情况下,可能性和回报期的估计可能很重要,例如用于水力发电的极端降雨事件。这些回报期估计的置信度受数据质量影响。因此,对基础数据不确定性的仔细量化并将其适当传递到指标中,可以 greater 置信度地估计衍生量,如回报期,或接近临界点的新出现不稳定性。
相关信息缺失限制了我们的决策能力。在回报时间的情况下,例如第2.2节中的干旱发生,考虑不确定性可能对相关指标的约束产生直接影响。如果我们的估计约束较差,那么我们对采取适当行动以减轻可能未来事件的信息就较少。在气候建模中,缺乏 well-characterised 不确定性信息限制了我们有效评估模型对气候系统表示的能力,这增加了过程表示的不确定性,并 potentially 增加了未来气候预估的不确定性。
对于某些用例,提供每个值上总不确定度的估计很重要——真实值所在的区间是什么?应该非常清楚包含和不包含的内容——是否有缺失的关键不确定性(例如上述XCO2案例中的采样不确定性)?了解缺失的误差组件可能是要传达的最重要信息,因为低估的不确定性可能导致数据的不正确使用。请注意,观测系统的局限性也可能是某些应用不确定性的关键组成部分,特别是在可能存在系统性遗漏的情况下——例如小火的情况,其中未被较低分辨率(500米)观测捕获的火灾在可以被较高分辨率(20米)仪器观测时几乎占可观测燃烧面积的一半。
清晰地传达不确定性,以所有数据用户都能访问的方式,对于促进其在下游应用中的使用至关重要(无论尺度如何)。数据生产者-用户伙伴关系通常分为三大类:1) 与数据生产者没有联系的用户;2) 具有高数学素养和特殊、数学上细致应用的数据用户,他们可以更容易地使用数据生产者提供的关于其产品的高度技术性信息;3) 中介,数据在决策场景中使用,数据用户和生产者之间存在 some 联系。在所有情况下,不确定性信息传达的清晰性和一致性至关重要。特别是对于案例1,关于数据产品的文档应该易于访问、清晰呈现、术语使用和定义一致,并以非专家易于访问的方式传达。提供配方或预计算指标上的不确定性提供了快速查看不确定性估计,捕获了数据的专家理解,并使用户能够将其自己的计算与预计算数字进行交叉检查。它还 potentially 允许使用不确定性信息,而用户无需执行正式传递(例如 https://surftemp.net)。在案例2中,可能需要更详细的产品规格(例如CCI文档,参见 https://climate.esa.int/en/projects/),包括完整的数学推导;但这些 only 对于具有高数学素养的数据用户来说是一个可访问的入口点。案例3涉及数据用户和生产者之间更多的沟通,额外需要清晰的口头沟通和对数据使用决策场景的共同理解。这些案例可能采取研究项目的形式,例如甲烷卫星检测评估(MEDUSA)项目,旨在了解与复杂观测 landscape 相关的不确定性哪些方面与特定用户需求相关。

展望

本文通过案例研究表明,所考虑科学问题的关注尺度影响观测不确定性贡献的相对重要性,并且这有可能影响基于衍生信息做出的决策。尽管全球图景在长期预估和大尺度能量收支方面仍然重要,但同时存在向越来越成熟的信息 landscape 发展的趋势,用于人和社区尺度上的行动以及适应和减缓路径,在更短期和局部、更高分辨率上。诸如间隙填充等过程,作为全球分析的既定组成部分,在某些背景下可能对于确保某些信息内容至关重要,但在局部或次年度尺度上可能变得 actively 不受欢迎(例如对于临界点,单传感器分析可能有益)。
高质量的决策,确保对所提出问题做出合理且经过衡量的响应,需要三个组成部分:(1)清晰阐述必须回答的问题,包括其组成部分、约束和输入要求的映射;(2)对于每个组成部分,映射和传递相关数据及相关不确定性;(3)将(2)集成到(1)中,以便做出决策。
对于单个决策——例如防洪规划,通常具有非常不同科学语言的社区之间以及与经历影响的社区之间的联系需要时间、努力和相关的可持续资金来建立。大规模 well-informed 决策 further 需要将局部尺度决策推广到关注领域。这在第一次全球盘点的技术对话中被确定为适应 landscape 中的一个障碍。然而,有证据表明,协调方法开始在某些部门扎根,例如甲烷警报和响应系统(UNEP-MARS)及相关甲烷卫星检测评估(MEDUSA)项目,以及协调适应平台,例如哥白尼应急管理服务。从数据到大规模决策的流水线开发必须成为优先事项,如果我们要在弥合实施差距方面取得进展,以实现《巴黎协定》的目标。
最终,如果 good 质量数据未被开发用于决策,那么将使用较差的信息——这可能提供较弱的约束,并且平均而言,我们将做出 less-well informed 决策。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号