全球热带气旋预报的基准数据集与深度学习方法:TropiCycloneNet的创新突破

【字体: 时间:2025年07月02日 来源:Nature Communications 14.7

编辑推荐:

  为解决热带气旋(TC)预测中数据匮乏与模型精度不足的问题,研究人员开发了多模态数据集TCND和集成AI-气象学的预测模型TCNM。该研究覆盖全球六大洋盆70年数据,通过环境时间网络(Env-T-Net)和多生成器架构(GC-Net)显著提升轨迹与强度预测精度,超越现有深度学习方法和官方气象机构。成果为灾害防控提供了开源工具,推动数据驱动的气象研究。

  

热带气旋(TC)是威胁人类社会的重大自然灾害,其预测精度直接关系到防灾减灾成效。然而,传统数值天气预报(NWP)依赖超算资源且成本高昂,而现有深度学习模型又受限于数据单一性和环境因素整合不足,难以实现高精度预测。更棘手的是,全球缺乏开放的多模态TC数据集,阻碍了AI技术在气象领域的深度应用。

针对这一挑战,浙江大学的Cheng Huang、Pan Mu团队联合多家机构开发了TropiCycloneNet系统。该系统包含两个核心部分:全球首个开源多模态TC数据集TCND,以及融合气象学知识的深度学习模型TCNM。研究成果发表于《Nature Communications》,为TC预测领域树立了新标杆。

研究团队采用三大关键技术:1) 通过ERA5再分析数据和IBTrACS等公开资源构建包含3630个TC的多模态数据集,整合一维属性(Data1d)、三维气象场(Data3d)和环境数据(Env-Data);2) 设计环境时间网络(Env-T-Net)捕捉TC与环境因子的动态交互;3) 开发多生成器架构(GC-Net)生成多种可能路径,模拟气象预报中的不确定性。

数据集构建与验证
TCND覆盖1950-2021年全球六大洋盆数据,包含经纬度、气压等Data1d,以及海温(SST)、位势高度(500 hPa)等Data3d。环境数据创新性地引入副热带高压位置、移动速度等关键因子。如图3所示,数据集包含不同强度等级的TC分布,其中西太平洋(WP)占比最高(1781例)。

模型架构创新
TCNM采用生成对抗网络(GAN)框架,其核心突破在于:

  1. 3D-Data Encoder基于3D-Unet处理气象场数据,如图2红色分支所示;
  2. Env-T-Net通过Transformer建模环境时序特征(图2金色分支);
  3. GC-Net通过概率选择机制激活不同生成器,输出多组预测轨迹(图2底部轮盘设计)。

性能验证
实验显示,TCNM在24小时预测中,轨迹误差(93.76 km)比官方预报(CMO)降低20%,强度预测误差(1.75 m/s)降低52%。如图5所示,在快速增强(RI)和转向(Recurving)等极端案例中,其性能优势更为显著。图6可视化对比显示,TCNM的预测区域(橙色)比MMSTN(蓝色)更贴近实际路径(红色)。

这项研究的里程碑意义在于:首次构建了全球尺度的开源TC数据集TCND,解决了AI气象研究的"数据荒"问题;提出的TCNM模型通过环境因子融合和多生成器机制,实现了气象学原理与AI技术的协同优化。特别是Env-T-Net模块,开创性地将副热带高压等环境动态纳入深度学习框架,为极端天气预测提供了新范式。未来,该成果可与Pangu-Weather等大模型结合,进一步提升长期预测能力,为全球气候变化背景下的灾害防控提供关键技术支撑。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号