MareNostrum5超算系统性能评估:面向复杂科学计算任务的能效优化与架构创新

【字体: 时间:2025年09月20日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  本文深入评估欧洲预百亿亿次超级计算机MareNostrum5的混合架构性能,通过微基准测试(浮点运算、内存带宽)、HPC标准测试(HPL/HPCG)及实际应用案例(Alya、OpenFOAM、IFS),系统分析其能效表现与扩展性,为复杂科学计算(如计算流体力学、气候建模)提供关键优化参考。

  

核心发现

  • 微基准测试显示Sapphire Rapids CPU可实现99%理论浮点吞吐量,但AVX2/AVX512指令会导致频率降至2.2 GHz
  • HBM节点内存带宽是DDR节点的3.5倍,但仅达到峰值的39.40%,表明CPU未能完全利用内存技术潜力
  • GPP分区能效较MareNostrum4提升1.76倍,但GPU系统(ACC分区)表现更优。HPCG测试中系统仅能维持1.2%的RPeak
  • 应用层面(Alya、OpenFOAM、IFS)的主要限制因素是负载均衡,但超过64/200节点时通信网络成为扩展性瓶颈
  • EAR(Energy Aware Runtime)能源监控框架支持用户对任务能耗进行精细化分析

系统概览

MareNostrum5是巴塞罗那超算中心(BSC)部署的预百亿亿级EuroHPC超算系统,峰值算力314 PFlop/s,采用Bull Sequana XH3000与联想ThinkSystem混合架构。系统包含四个针对性优化的计算分区,全面覆盖高性能计算(HPC)用户需求。

底层基准测试

本节重点评估GPP节点的三个核心组件:首先实测空闲CPU功耗,随后通过微基准测试分析CPU性能(频率与每周期浮点运算)、内存子系统(带宽与延迟)及网络性能。

HPC标准测试

本节展示Top500排名基准HPL与HPCG的持续性能表现,包含GPP与ACC分区的单节点/多节点测试结果,并分析HPL的功耗与能效特性。

HPC应用扩展性

在完成硬件独立性能与标准基准测试后,本节评估三类科学应用的扩展性:计算流体动力学(CFD)与气候气象数值模型,这两类应用在全球数据中心计算资源中占比显著且具有高度异构性。

结论

本文通过对MareNostrum5超算系统的架构特性、多层级基准测试及科学应用性能的全面分析,为用户优化工作流程提供实践指导,补充了传统技术文档的不足。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号