编辑推荐:
生态预报挑战(Ecological Forecasting Challenges)是旨在赋能生态学界开发尚未采集数据的近期限迭代预测的正式化努力,是提升生态学预测能力的强大工具。自2021年以来,国家生态观测站网络(NEON)生态预报挑战(NEON Ecolo
生态预报挑战(Ecological Forecasting Challenges)是旨在赋能生态学界开发尚未采集数据的近期限迭代预测的正式化努力,是提升生态学预测能力的强大工具。自2021年以来,国家生态观测站网络(NEON)生态预报挑战(NEON Ecological Forecasting Challenge)已处理超过8200万次单个预测,覆盖81个站点,充分体现了这一方法。然而,支撑此类大规模、社区驱动预报工作所需的网络基础设施(CI)尚未得到全面描述。在此,研究人员介绍了为NEON挑战开发的CI的设计原则、技术实现及经验教训。该无服务器开源平台自动化了关键任务,包括目标数据生成(target data generation)、概率预报提交处理(probabilistic forecast submission-processing)、使用适当评分规则(proper scoring rules)进行评价以及结果发布。该CI利用云原生技术——包括基于简单存储服务(S3)的存储、GitHub Actions和Docker容器——确保可扩展性、可重复性和供应商无关的部署。CI还包含降低贡献者门槛的工具,例如用于预报提交的R包、作为模型驱动因子(model drivers)的天气预报访问以及教程。仪表板(dashboard)和可搜索目录增强了透明度和可获取性。研究人员的经验表明,预报挑战可以作为社区参与、教育和综合的焦点。CI的模块化设计使其能够适应新的观测站和不断发展的技术,为未来的生态预报工作提供了路线图。通过记录该基础设施,研究人员旨在赋能研究者启动和维持预报挑战,从而通过预测推进生态学理解。
**论文解读**
生态预报挑战(Ecological Forecasting Challenges)是生态学领域推动预测能力发展的关键举措,通过组织社区对尚未收集的数据进行近期限迭代预测,系统评估不同生态系统类型、生态组织尺度及未来时间跨度(lead time)上的预测能力。然而,支撑此类大规模、社区驱动预报工作的网络基础设施(CI)尚未得到充分描述。现有系统如White等(2018)的自动化预报CI仅适用于有限目标和模型,缺乏处理大量社区提交的可扩展性;其他研究聚焦于通过参数校准、数据同化和可视化改进模型的迭代工作流,而非创建持续运行的服务来管理多种模型的提交、处理和评估;商业平台如Kaggle主要用于单次截止日期提交的数据科学竞赛,不适用于迭代预测。因此,开发一个开源、可扩展、支持持续运行的CI对推动生态预报挑战至关重要。
研究人员针对国家生态观测站网络(NEON)生态预报挑战(NEON Challenge,Thomas等,2023),设计并实现了一套基于无服务器架构的开源CI平台,旨在满足目标数据生成、社区预报提交处理、基于适当评分规则(proper scoring rules)的评价、结果存档与发布等核心需求。该平台自2021年运行至2025年1月,已处理超过216万个预报提交(2,164,259次)和8286万个观测-预报对(82,864,101对),涵盖10个社区选择的目标变量(targets),涉及195种独特的建模框架。研究得出以下结论:预报挑战能有效组织社区,推动标准制定、最佳实践总结和跨系统预测能力分析;无服务器、供应商无关、基于S3存储和标准(如SpatioTemporal Asset Catalog [STAC])的CI设计可确保可扩展性、可重现性和未来适应性。该论文发表在《Ecosphere》。
**主要关键技术方法**
研究人员采用无服务器(serverless)功能即服务(Function-as-a-Service)云计算模型,使用GitHub Actions触发定时任务,结合Docker容器(基于Rocker Geospatial)确保环境可重现。数据存储基于简单存储服务(S3)协议,使用Parquet列式文件格式实现数据库式分区管理(按duration/target variable/model_id/reference_datetime分区),并通过STAC和GeoCODES软件建立目录与搜索能力。关键工具包括:用于预报提交的R包(支持格式验证和上传)、从NOAA全球集合预报系统(GEFS)子集化获取天气预报的管道(gefs4cast)、以及基于Quarto的静态仪表板(dashboard)。样本队列来自美国国家生态观测站网络(NEON)的81个站点,包括34个水生和47个陆生站点,涵盖传感器、涡度协方差塔(eddy covariance towers)和物候相机(Phenocams)等测量数据。
**研究结果**
**目标生成(Target generation)**:通过自定义脚本从NEON数据门户下载原始数据,经质量标记(quality flags)和聚合(例如将10分钟传感器数据转换为日均值)处理后,生成长格式CSV文件,包含datetime和duration列以支持不同时间聚合水平(如日、周)共存。目标数据随观测站新数据自动更新,更新频率由观测站数据发布间隔决定。
**预报提交(Forecast submissions)**:贡献者使用任意建模方法生成包含不确定性的预测(通过参数分布或集合成员表示),并按迭代方式(例如每日)提交整个指定水平(horizon)的预测(如每日变量35天前向、每周变量52周前向)。提交前需在线上表单注册模型,信息自动转换为JSON元数据文件。提交过程依赖S3存储桶(submission bucket)实现匿名或凭证上传,CI自动验证格式后移入存档桶。
**预报基线(Forecast baselines)**:CI自动生成两种基线模型:持续性基线(persistence baseline,假设未来等于最新目标值,不确定性用随机游走建模)和日序(DOY)均值基线(假设未来等于该日序的历史均值,不确定性用历史方差表示)。基线用于提供默认基准和定期测试CI运行状态。
**预报提交处理(Forecast submission processing)**:自动脚本从提交桶读取预报,验证格式后记录处理时间戳(pub_datetime),并以Parquet格式序列化到存档桶,按duration/target variable/model_id/reference_datetime分区,避免覆盖历史数据。同时生成汇总统计(均值、中位数、95%区间)用于高效可视化。
**预报评价(Forecast evaluation)**:使用连续分级概率评分(CRPS,Continuous Ranked Probability Score)作为主要指标,通过scoringRules R包计算,评估完整预报分布的准确性和精确性。处理迭代挑战中同一观测值被多个不同水平预报的问题,只对未评价且有新观测的预报进行计算,以避免冗余计算。
**预报与评分存档及目录(Forecast and score archive and catalog)**:所有预报、目标及评分存储于S3存档桶(公共可下载,仅组织者可上传),通过STAC结构化元数据JSON文件和在线STAC浏览器实现浏览。GeoCODES软件提供更灵活的查询(如边界框、站点名、关键词过滤)。
**仪表板(Dashboard)**:基于Quarto的静态网站每日自动更新,展示不同模型的最新预报、最近被完全评价的预报结果以及按模型和变量分组的平均CRPS,还提供按水平对比的CRPS。仪表板同时作为挑战主要文档页。
**预报提交支持(Forecast submission support)**:开发了R包(https://doi.org/10.5281/zenodo.18600153),包含提交函数、格式验证工具和天气预报获取函数。CI从NOAA GEFS子集化获取预报并存储为与生态预报相同模式(schema)的数据;还提供历史天气预报产品(stage3)以减少使用天气模型训练与预测间的差异。此外,社区开发了系列教程(Olsson等,2024;Sokol等,2024)。
**自动化与可重现性(Automation and reproducibility)**:使用GitHub Actions定义每个任务的YAML配置文件(触发条件、计算环境、执行脚本),Docker容器每日自动重建以更新软件包。任务可运行于不同功能即服务提供商(如Amazon Lambda、Google Cloud Functions),使用FaaSr软件促进跨平台复用。
**讨论与结论**
讨论部分指出,该CI的设计原则(无服务器、S3存储、供应商无关、共享标准、灵活可扩展、开源)使其能随着NEON挑战的快速增长而扩展,并成功处理超过8200万次预测。CI的模块化组件允许独立使用或组合,单个组件可替换而不影响整体。启动新挑战需要S3存储桶、GitHub仓库克隆及配置文件的更新,要求团队具备GitHub、R、GitHub Actions和云存储经验。分散式CI无需中央预报主机,但建议由生态预报倡议(Ecological Forecasting Initiative,Dietze & Lynch,2019)担任清算所以提高可发现性。经验表明,预报挑战可有效组织社区,推动标准(Dietze等,2023)和最佳实践(Lewis等,2022;Malmborg等,2024)的发展,并作为教学工具(大学课程、短课程、学会研讨会)。具有最短延迟(data latency)的变量(如物候变量)吸引了最高的社区参与。未来改进方向包括:支持网格化时空变量(如遥感数据)、开发Python接口以吸引机器学习社区,以及评估商业云平台运行成本。
**结论部分翻译**:
尽管迭代预报在生态学中的需求已有充分文献记载,且此类实践的案例正在涌现(Lewis等,2022),但关于实现这些目标所需的技术要素的讨论仍然很少。在此,研究人员概述了生态预报挑战CI的高层设计原则和具体实现。这些原则使该服务得以随着挑战的快速增长而扩展——该挑战已持续超过4年,并产生了来自全球科学家开发的各种建模方法的超过8200万次个体预测。研究人员希望通过分享其方法和经验教训,更多研究者能够开发出促进、评分和比较迭代预报预测的服务。