
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于张量核心稀疏内核加速深度神经网络
《IEEE Transactions on Parallel and Distributed Systems》:Based on Tensor Core Sparse Kernels Accelerating Deep Neural Networks
【字体: 大 中 小 】 时间:2025年12月09日 来源:IEEE Transactions on Parallel and Distributed Systems 6
编辑推荐:
针对大型语言模型参数多导致的存储和计算挑战,提出基于Tensor Core的TC-CSR稀疏矩阵格式,设计块稀疏矩阵乘法(SpMM)和采样密集矩阵乘法(SDDMM)内核,在中等稀疏场景实现141%加速,大规模高稀疏矩阵达138%加速,并在稀疏Transformer推理中实现175%加速并节省内存。
生物通微信公众号
知名企业招聘