基于I/O调用栈图模型的高性能计算应用预测预取方法研究

【字体: 时间:2025年08月03日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  为解决高性能计算(HPC)存储系统中异构存储层级间的数据预取效率问题,研究人员开展基于调用栈图模型(GrIOt)的I/O模式预测研究。通过构建有向图模型替代传统语法压缩算法,实现了对POSIX/STDIO I/O模式的高精度预测(准确率最高达98%),模型开销降低120倍,体积缩小15倍。该研究为HPC存储系统提供了兼顾预测精度与低开销的灰色框预取方案。

  

在当今高性能计算领域,存储系统性能已成为制约整体效率的关键瓶颈。随着SSD、NVM等高速存储设备与HDD容量型存储构成的多层异构架构普及,如何通过精准预取实现数据在存储层级间的动态迁移成为研究热点。传统预取技术面临三重困境:依赖应用源代码的白箱方法适用性有限,基于概率模型的黑箱方案预测准确率低,而采用语法压缩的灰色框方法(如Omnisc'IO)虽能通过调用栈分析I/O模式,但对不规则应用的建模效率低下,模型体积膨胀且预测延迟高达10ms。

法国国立高等先进技术学院(ENSTA, Institut Polytechnique de Paris)联合法国国家科学研究中心(CNRS)的研究团队创新性地提出GrIOt图模型框架。该研究通过构建动态有向图替代传统的Sequitur语法压缩算法,将I/O调用栈序列转化为节点间的转移关系,配合Most Recently Used(MRU)和Most Frequently Used(MFU)启发式策略,实现了对规则与非规则HPC应用I/O模式的高效预测。相关成果发表于《Future Generation Computer Systems》,为解决存储墙问题提供了新思路。

研究团队采用LD_PRELOAD动态拦截技术捕获POSIX/STDIO函数调用,通过libunwind获取调用栈快照并生成64位Murmur2哈希值。创新性地设计三种建模粒度:单进程模型保留全局I/O模式;按文件描述符建模实现精准文件级预测;基于文件打开调用栈的模型支持跨文件知识复用。采用上下文窗口(context size)机制增强节点状态表征,结合哈希表加速图遍历与参数查询。

研究结果显示:在NAMD、LAMMPS等五种真实HPC应用的测试中,GrIOt展现出显著优势。模型预测方面,采用进程级建模时I/O调用栈预测准确率与Omnisc'IO相当(LQCD达97.91%),而按文件打开调用栈建模时正确预测数据量占比更高。性能开销方面,模型更新与预测延迟最低仅334ns,较基线降低120倍(LAMMPS应用),内存占用缩减10-15倍(LQCD应用模型仅463B)。参数优化实验表明,上下文窗口设为2时可平衡准确率与模型体积,而32层调用栈深度能充分保持栈信息区分度。

值得注意的是,研究团队首次系统评估了调用栈检测技术对系统的影响。数据显示libunwind较GNU backtrace降低10-50%的检测开销,这为实际部署提供了重要参考。通过对比三种建模粒度,证实文件级模型能有效捕捉I/O空间局部性,其加权预测准确率超越进程级模型15%,同时维持亚微秒级预测延迟。

该研究的突破性在于:首次证明无需完整保留调用栈序列(lossless encoding)仍可实现高效预测,通过有向图转移关系替代语法规则,使模型复杂度仅与唯一调用栈数量而非I/O总量相关。提出的多粒度建模框架既支持传统进程级预测,又能实现文件精准预取,为异构存储系统的自适应数据调度提供了新范式。未来通过与MPI-IO的集成及模型融合算法的开发,GrIOt有望成为HPC存储加速的关键技术。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号