DAHBM-GCN:一种具有多种数据流和HBM的灵活图卷积网络加速器
《IEEE Transactions on Parallel and Distributed Systems》:DAHBM-GCN: A Flexible Graph Convolution Network Accelerator with Multiple Dataflows and HBM
【字体:
大
中
小
】
时间:2025年11月25日
来源:IEEE Transactions on Parallel and Distributed Systems 6
编辑推荐:
针对图卷积网络(GCN)在异构图数据集上的计算效率问题,本文提出基于多数据流与高带宽内存(HBM)的DAHBM-GCN加速器。设计支持多数据流、聚合优先与组合优先的智能计算引擎,结合决策树自适应选择最优流;创新性采用伪通道映射优化HBM带宽,缓解内存瓶颈;提出混合量化策略降低计算复杂度与参数量,同时保持精度。实验表明,DAHBM-GCN在CPU上较PyG-GCN、DGL-GCN加速比达52.5-129.3倍,在FPGA上较现有加速器平均提升1.18-2.68倍,兼具高灵活性与低能耗优势。
摘要:
图结构数据已广泛应用于交通、分子和电子商务网络等领域。图卷积网络(GCN)作为一种处理非欧几里得图数据的有效方法应运而生。然而,图数据集的大小和稀疏性各不相同,加之GCN计算中的数据流模式依赖于图数据本身,这使得GCN推理的加速变得越来越具有挑战性。本文提出了一种基于多数据流和高带宽内存(HBM)的GCN推理加速器,命名为DAHBM-GCN。首先,我们设计了一种支持多种数据流顺序(聚合优先和组合优先)的计算引擎。其次,提出了一种基于决策树的自适应选择器,用于选择最优的数据流计算引擎。第三,设计了一种针对多通道HBM的高效伪通道(PC)映射方式,以提升带宽,有效缓解内存延迟和带宽瓶颈问题。第四,引入了一种混合定点量化策略,能够在几乎不损失精度的情况下降低GCN模型的计算复杂度和参数数量。最后,广泛的性能评估实验表明,在各种数据集上,DAHBM-GCN相对于PyG-GCN在CPU上的平均加速比为52.5–129.3倍,相对于DGL-GCN为4.9–7.9倍;与基于FPGA的AWB-GCN、HyGCN、HLS-GCN和GCNAX加速器相比,DAHBM-GCN在各种数据集上的平均加速比分别为1.21–2.21倍、1.25–1.98倍、1.65–2.68倍和1.18–1.56倍。此外,DAHBM-GCN还具有灵活性高和能耗低的优点。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号