在GPU上实现的多层内罚方法

《ACM Transactions on Mathematical Software》:Multilevel Interior Penalty Methods on GPUs

【字体: 时间:2025年11月07日 来源:ACM Transactions on Mathematical Software

编辑推荐:

  高阶离散单元法GPU加速矩阵自由多网格方法研究,提出基于共享内存无冲突访问的优化实现,在NVIDIA A100上达到40%峰值吞吐量,验证混合精度与MPI并行化有效性,并开展二维三维应用评估。

  

摘要

我们提出了一种无需矩阵计算的多网格方法,用于高阶离散伽辽金(Discontinuous Galerkin, DG)有限元方法,并结合了GPU加速技术。通过对不同数据结构和计算布局进行性能分析,发现通过局部化处理和快速对角化技术可以优化算法实现。利用共享内存中的无冲突访问模式,在NVIDIA A100 GPU上实现了高达峰值性能40%的算术吞吐量。实验结果证实了混合精度计算方法和消息传递接口(Message Passing Interface, MPI)并行化的有效性。此外,还对求解器的效率和鲁棒性进行了评估,涵盖了二维和三维情况,并应用于泊松问题(Poisson problems)的求解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号