FR2eRAM:一种适用于实际ReRAMs的容错图处理范式

《IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems》:FR2eRAM: A Fault-Resilient Graph Processing Paradigm in Realistic ReRAMs

【字体: 时间:2026年01月07日 来源:IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems 2.9

编辑推荐:

  ReRAM图处理硬件故障注入与可靠性优化研究提出ReGFI微架构级故障注入框架,通过精准映射硬件故障到图执行流程,结合顶点值反向映射和非理想交叉点主动SE规避,以及闲置交叉点回收与近似有效位提取的协同优化策略,在实验中实现88.84%的严重错误消除率。

  

摘要:

随着现代图数据的爆炸性增长,基于电阻式随机存取存储器(ReRAM)的图处理范式正成为解决“内存墙”瓶颈问题的有希望的解决方案。然而,现有的范式往往依赖于过于理想化的ReRAM架构,忽略了由于ReRAM的模拟特性和 immature 制造工艺而导致的各种硬件故障的关键影响。这些硬件故障可能导致收敛异常或不可接受的输出偏差(即严重错误(SEs)),从而削弱了基于ReRAM的图处理的可靠性。虽然一些研究通过故障感知的重映射或鲁棒算法设计来提高基于ReRAM的计算的可靠性,但图执行的独特特性使得这些努力难以有效迁移。在这项工作中,我们首先开发了ReGFI,这是一个针对基于ReRAM的图处理的微架构级故障注入框架。与仅引入随机算法级故障的传统故障注入(FI)方法不同,ReGFI能够将硬件故障精确地映射到微架构的图执行流程中,从而有效地表征其对执行正确性的影响。基于ReGFI,我们提出了FR2eRAM,这是一种在现实ReRAM中具有故障抵抗能力的图处理范式。首先,观察到图顶点相对于图边的故障鲁棒性,我们将顶点值反向映射到非理想的交叉开关上,同时使用边值作为输入,以主动避免严重错误。然后,利用ReRAM交叉开关中的单元空闲时间和图数据的位级可靠性差异,我们回收空闲的交叉开关单元并提取近似的最不重要位,以鲁棒地编码对故障敏感的位,从而进一步消除严重错误。实验结果表明,FR2eRAM在实现基于ReRAM的图处理的故障抵抗能力的同时,仅产生了可以忽略的开销,严重错误减少了88.84%。此外,我们还在不同条件下评估了FR2eRAM的有效性和性能...

引言

图处理作为探索和分析现实世界实体之间关系的关键技术,受到了广泛关注,并被应用于交通网络、金融应用等多个领域[1]、[2]、[3]。随着现代图数据量的爆炸性增长,基于电阻式随机存取存储器(ReRAM)的图处理范式已被广泛提出,以克服由于计算与通信比率低以及数据访问模式不规则而导致的“内存墙”瓶颈[1]、[4]、[5]。通过将计算逻辑单元直接集成到存储器中,基于ReRAM的处理可以在能效和吞吐量方面实现显著提升[6]、[7]、[8]、[9]、[10]。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号