基于深度集成填补缺口改进涡度协方差二氧化碳平衡的不确定性估计

【字体: 时间:2025年05月16日 来源:Agricultural and Forest Meteorology 5.6

编辑推荐:

  为解决涡度协方差(EC)测量 CO?平衡缺乏合理不确定性估计的问题,研究人员探究缺口填补方法的误差及不确定性估计。发现随缺数据比例增加,随机不确定性上升,深度集成神经网络表现更优,为 EC 数据应用提供重要参考。

  在生态系统与大气间二氧化碳(CO?)交换的研究中,涡度协方差(EC)技术是常用手段,可量化 CO?通量以确定生态系统的 CO?平衡。然而,EC 测量数据常因仪器故障、环境条件等出现缺口,需通过缺口填补方法处理,且缺乏统一的不确定性估计方法,导致不同处理、控制或站点间的比较缺乏意义,也影响数据同化、模型校准等工作。因此,准确评估缺口填补带来的随机和系统误差,以及现有方法的不确定性估计是否可靠至关重要。
芬兰相关研究人员开展了关于涡度协方差法 CO?平衡不确定性估计的研究,该研究成果发表在《Agricultural and Forest Meteorology》。

研究主要采用了以下关键技术方法:使用基于神经网络的深度集成、梯度提升决策树等机器学习方法,以及边际分布采样(MDS)这一标准缺口填补方法;利用简化合成 CO?通量数据(仅依赖温度变量)、12 个欧洲森林站点的实测 CO?通量数据,以及生态系统模型生成的 4 个森林站点合成数据进行分析;通过在数据中制造人工缺口,计算不同方法产生的随机和系统误差,并与不确定性估计对比。

简化合成数据的不确定性估计


通过建模生态系统呼吸,利用实测气温和指数呼吸模型生成仅依赖单一环境变量的简化合成 CO?通量数据。结果显示,对于随机采样测试集,各方法预测区间覆盖概率(PICP)良好,但 MDS 和决策树基方法(XGB、NGB)无法外推训练数据外的温度范围,且 MDS 和 NGB 对分布外(OOD)测试集的不确定性估计过小,未包含真实通量值,神经网络(NN)则低估真实值。

不同缺口比例下的误差与不确定性


利用欧洲森林站点合成数据研究发现,当缺失数据比例从 30% 增至 90% 时,与缺口填补相关的随机不确定性(σrnd,由观测模型误差计算)随站点和方法不同,从约 10 g C m-2 y-1增至 25–75 g C m-2 y-1。深度集成神经网络的随机误差小于标准 EC 缺口填补方法 MDS,且能更好估计 CO?平衡的不确定性。

长缺口的影响与不确定性


长达一个月的长缺口导致的随机不确定性大多小于 50 g C m-2 y-1,但在干旱温暖时期且测量中未充分体现的长缺口,随机不确定性可达 99 g C m-2 y-1。除生态系统活跃变化期的极端困难情况外,深度集成对长缺口的不确定性估计校准良好,而 MDS 对长缺口的不确定性估计明显过小。

不同方法的不确定性校准能力


树基机器学习方法对短期通量的不确定性估计校准良好,但对平衡的估计不佳,且无法外推训练数据外的情况;深度集成神经网络在处理分布偏移和 OOD 数据时,能产生更可靠的不确定性估计,具备外推能力。

研究结论表明,缺失数据比例和缺口 timing 显著影响 CO?平衡的随机和系统误差,现有方法中深度集成神经网络在缺口填补和不确定性估计方面表现更优,能更好处理长缺口和分布外数据,为 EC 数据的多站点分析、模型校准等提供了更可靠的不确定性估计方法,有助于提升生态系统 CO?平衡研究的准确性和可比性,对气候变化研究和政策制定具有重要意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号