在GPU上实现的多层内罚方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

在GPU上实现的多层内罚方法

《ACM Transactions on Mathematical Software》：Multilevel Interior Penalty Methods on GPUs

【字体：大中小】 时间：2025年11月07日 来源：ACM Transactions on Mathematical Software

编辑推荐：

　　高阶离散单元法GPU加速矩阵自由多网格方法研究，提出基于共享内存无冲突访问的优化实现，在NVIDIA A100上达到40%峰值吞吐量，验证混合精度与MPI并行化有效性，并开展二维三维应用评估。

摘要

我们提出了一种无需矩阵计算的多网格方法，用于高阶离散伽辽金（Discontinuous Galerkin, DG）有限元方法，并结合了GPU加速技术。通过对不同数据结构和计算布局进行性能分析，发现通过局部化处理和快速对角化技术可以优化算法实现。利用共享内存中的无冲突访问模式，在NVIDIA A100 GPU上实现了高达峰值性能40%的算术吞吐量。实验结果证实了混合精度计算方法和消息传递接口（Message Passing Interface, MPI）并行化的有效性。此外，还对求解器的效率和鲁棒性进行了评估，涵盖了二维和三维情况，并应用于泊松问题（Poisson problems）的求解。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号