HS-GCN:一种高性能、可持续且可扩展的基于芯片片的加速器,用于图卷积网络推理

《IEEE Transactions on Sustainable Computing》:HS-GCN: A High-Performance, Sustainable, and Scalable Chiplet-Based Accelerator for Graph Convolutional Network Inference

【字体: 时间:2025年11月21日 来源:IEEE Transactions on Sustainable Computing 3.9

编辑推荐:

  图卷积网络(GCN)硬件加速面临数据量和通信效率的双重挑战。本文提出HS-GCN芯片片加速器,通过动态控制算法和可重构芯片片阵列优化计算流,实现26.7倍加速与87%能效提升。

  

摘要:

图卷积网络(GCNs)被提出用于扩展机器学习技术在图相关应用中的能力。典型的GCN模型包含多个层次,每个层次都包括一个通信密集型的聚合阶段和一个计算密集型的组合阶段。随着现实世界中图的大小呈指数级增长,当前的定制加速器在高效执行GCN推理时面临挑战,因为片上缓冲区和其他用于数据计算和通信的硬件资源有限,这降低了性能和能效。此外,将现有的单体设计进行扩展以应对上述挑战会在功耗、面积和产量方面引入显著的成本效益问题。为此,我们提出了HS-GCN,这是一种高性能、可持续且可扩展的基于芯片组的加速器,用于GCN推理,并大幅提高了能效。具体来说,HS-GCN集成了多个可重构的芯片组,每个芯片组都可以配置为执行聚合阶段或组合阶段的主要计算任务,包括稀疏-密集矩阵乘法(SpMM)和通用矩阵-矩阵乘法(GeMM)。HS-GCN采用了一个具有灵活互连结构的主动中介层来连接芯片组和其他硬件组件,以实现高效的数据通信。此外,HS-GCN引入了两种系统级控制算法,这些算法根据输入图和GCN模型动态确定计算顺序和相应的数据流。这些选择用于进一步配置芯片组阵列和互连结构,从而显著提高性能和能效。使用真实世界图进行的评估结果显示,与现有方法相比,HS-GCN实现了26.7倍、11.2倍、3.9倍、4.7倍的速度提升,以及94%、89%、64%、85%的内存访问节省,以及平均87%、84%、49%、78%、41%的能耗节省。

引言

图卷积网络(GCNs)最近被引入并应用于使用图结构数据的应用中,实现了显著的推理精度[1]、[2]、[3]、[4]、[5]、[6]、[7]。典型的GCN架构包含多个图卷积层,每个层由两个主要的计算阶段组成:聚合阶段和组合阶段[8]、[9]、[10]、[11]。在聚合阶段,输入图中的顶点从所有邻居节点收集特征。在组合阶段,每个顶点使用预训练的权重矩阵更新其聚合特征,并生成当前GCN层的输出矩阵。当前GCN层的输出矩阵将作为下一个GCN层的输入特征矩阵。随着输入图规模的爆炸性增长,用于GCN推理的数据量变得极其庞大,这对设计硬件加速器时的数据计算和通信提出了严格的要求。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号