编辑推荐:
为有效量化野火成因,研究人员构建 SeasFire 数据立方体,助力野火研究与预测。
# SeasFire 数据立方体:全球野火研究的新利器
在地球的生态舞台上,野火既是一位不羁的 “舞者”,塑造着生态的发展,又是一个可怕的 “破坏者”,给生态系统和人类生活带来巨大威胁。近年来,气候变化和人类活动的双重影响,让野火愈发频繁和剧烈,打破了自然的宁静。曾经,野火在生态系统中扮演着促进养分循环、推动生态演替等重要角色,然而现在,失控的野火却常常超出预期的强度和频率,无情地摧毁着生态服务系统、基础设施,危害着社区安全和公众健康。面对未来气候变化的严峻挑战,重新评估和制定野火适应与缓解策略迫在眉睫。
为了更深入地了解野火的奥秘,精准预测野火的发生和影响,来自多个国际研究机构的研究人员,包括希腊国家天文台、马克斯?普朗克生物地球化学研究所等,开展了一项具有开创性的研究。他们成功构建了 SeasFire 数据立方体(SeasFire datacube),这一成果发表在《Scientific Data》上,为全球野火研究带来了新的曙光。
研究人员在构建 SeasFire 数据立方体时,运用了多种关键技术方法。数据来源广泛,涵盖了欧洲中期天气预报中心(ECMWF)、哥白尼气候数据存储库(CDS)等多个权威机构。在数据处理过程中,运用了聚合(aggregation)、插值(interpolation)、滤波(filtering)和光栅化(rasterization)等技术。例如,通过聚合技术将不同时间分辨率的数据统一为 8 天的时间间隔;利用插值技术处理缺失数据;运用滤波技术去除噪声和异常值;采用光栅化技术将矢量数据转换为栅格格式,以适应数据立方体的存储和分析需求。
SeasFire 数据立方体设计
SeasFire 数据立方体是一个精心构建的时空数据集,它整合了 59 个变量,包括气候、植被、海洋指数和人类因素等多个方面。这些变量涵盖了各种领域,如气候要素中的海洋气候指数,大气参数中的温度、压力和湿度相关变量,以及土地相关方面的土地覆盖和人口密度变量等。数据立方体提供了 8 天的时间分辨率和 0.25° 的空间分辨率,时间跨度从 2001 年至 2021 年。这样的分辨率设置,既能够有效捕捉短期的环境变化,又能满足长期趋势分析的需求,同时在提供详细空间信息的基础上,兼顾了计算效率和与现有数据源的兼容性。
数据记录
SeasFire 数据立方体版本 0.4
12存储在.zarr 文件中,可通过 Zenodo 平台(
https://zenodo.org/record/13834057)访问。每个变量都包含丰富的元数据,如变量描述、聚合细节、数据集提供者和用户说明等,这些信息以属性的形式存储在 Zarr 文件中。Zarr 格式的优势在于其优化的分块存储方式,能够实现高效的多维网格数据访问、存储和基于时间的处理。每个变量被划分为 16 个大分块,维度分别为时间(966)、纬度(180)和经度(360),这种结构便于用户进行高级数据分析,用户无需加载整个数据集,就可以处理特定区域和时间范围内的数据。
技术验证
为了确保 SeasFire 数据立方体的可靠性和准确性,研究人员进行了全面的技术验证。通过视觉检查(Visual inspection),研究人员对数据立方体的变量进行了初步调查,重点关注用于因果关系评估和机器学习建模的变量,从而深入了解全球野火动态的时空模式。同时,运用因果分析(Causality)方法,通过验证地球系统科学中变量之间的理论因果关系,进一步增强了数据立方体的整体可靠性。例如,研究人员在欧洲地中海和北方地区,利用 SeasFire 数据立方体进行了一项长达二十年的实验,通过线性偏相关检验(ParCorr)和 PCMCI 方法,分析了气候、气象和燃烧面积之间的因果关系,结果表明数据集中的时间序列数据是可靠的。
使用说明
SeasFire 数据立方体在知识共享许可协议(Creative Commons License 4.0 International)下可供免费使用。研究人员建议用户使用多维数组(如通过 Xarrays(Python)或 YAXArrays.jl(Julia))来访问数据立方体。相关的 Python 和 Julia 代码可在 GitHub 存储库(
https://github.com/SeasFire/seasfire-datacube/tree/main)中获取,其中包含了许多示例笔记本,方便用户进行数据分析。此外,用户可以根据自身计算资源的情况,选择在本地或云端环境访问数据立方体,但需确保环境具备足够的随机存取存储器(RAM),加载单个变量大约需要 4GB 的 RAM。由于数据在一定程度上已经进行了预处理,用户可根据具体研究问题,对数据进行进一步的清洗、归一化或转换。
下游应用与局限性
SeasFire 数据立方体在野火研究的多个方面展现出巨大潜力。在机器学习建模方面,它可以用于建立野火相关变量之间的联系,预测野火发生的模式。例如,通过将数据立方体中的数据转化为机器学习任务,研究人员可以对不同预测时间跨度内的野火燃烧面积模式进行预测。此外,机器学习还可以借助该数据立方体,在其他领域发挥作用,如预测植被生长、干旱状况和火灾天气模式,改进野火排放预测等。然而,SeasFire 数据立方体也存在一定的局限性。其 0.25° 的空间分辨率虽然能够识别大规模的模式和全球趋势,但在代表局部变化方面存在不足,尤其是在地形或土地利用等细粒度因素对野火行为影响显著的地区。其 8 天的时间分辨率对于需要精确跟踪每日变化的场景来说,可能也不够充分。
SeasFire 数据立方体的出现,为全球野火研究提供了一个强大的工具。它不仅整合了丰富的多变量数据,而且在时空分辨率上实现了较好的平衡,能够满足多种研究需求。通过技术验证,其数据的可靠性和准确性得到了有效保障。尽管存在一定的局限性,但它为野火研究和预测开辟了新的道路,有助于研究人员更好地理解野火的发生机制,制定更有效的野火预防和管理策略,在全球野火研究领域具有重要的意义,为未来的野火研究和应对工作奠定了坚实的基础。