基于多GPU节点的APPLE-MASNUM轻量化并行加速框架:海洋数值波浪模型的高效计算突破

【字体: 时间:2025年06月16日 来源:Ocean Modelling 3.1

编辑推荐:

  针对海洋数值波浪模型MASNUM因计算资源需求大而难以在本地气象站轻量化部署的问题,研究人员开发了基于多GPU节点的APPLE-MASNUM并行加速框架。通过优化二维四点模板计算(2D4P)、计算-通信重叠策略及GPU友好数据布局,实现了单节点49.29-65.74倍的加速比,为极端海洋天气预警提供了高效解决方案。

  

海洋波浪预报对防灾减灾和航海活动至关重要,但传统海洋科学数值模型(Marine Science and Numerical Modeling, MASNUM)依赖大规模计算集群,难以满足地方气象站对轻量化、实时性预测的需求。随着极端海洋天气事件频发,地方站点面临资源有限与计算复杂度高的双重压力。为此,研究人员开发了首个基于多GPU节点的轻量化加速框架APPLE-MASNUM,显著提升了波浪模型的运算效率。

研究团队通过分析MASNUM的数学物理方程,识别计算瓶颈,将其从多进程MPI程序改造为GPU兼容算法。关键技术包括:(1)优化二维四点模板(2D4P)计算;(2)设计计算-通信重叠策略;(3)开发GPU适配的数据布局方案。实验采用32核Hygon C86-7185 CPU和四块32GB GPU的异构平台,对比单核MASNUM实现了最高65.74倍的加速。

相关工作中,研究追溯了MASNUM从LAGFD-WAM模型到第三代波浪模型的演进历程,强调其在耦合气候模型(如CMIP6)中的应用价值。物理模型与数值算法部分详细阐述了MASNUM通过波数谱平衡方程模拟波浪方向谱的机理,涵盖风输入、波浪破碎耗散等源函数。框架设计部分提出APPLE-MASNUM的轻量化架构,重点解决GPU负载均衡问题。数值实验部分验证了四个版本(v1-v4)的逐步优化效果,其中数据布局优化(v4)贡献显著。

结论指出,APPLE-MASNUM首次实现了MASNUM在GPU异构平台的部署,为地方站点提供了可行的轻量化解决方案。未来需进一步优化网格分区算法以平衡GPU-CPU负载。该研究发表于《Ocean Modelling》,标志着海洋数值模型高性能计算的重要突破。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号