ASTRA:一种结合硅光子技术的随机变换器神经网络加速器
《ACM Transactions on Embedded Computing Systems》:ASTRA: A Stochastic Transformer Neural Network Accelerator with Silicon Photonics
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Embedded Computing Systems
编辑推荐:
Transformer加速器在NLP、CV等领域表现优异但计算复杂度高,硅光子学通过随机计算和光硬件设计实现高效能计算,ASTRA在张量运算中速度提升7.6倍且能耗降低30.8%。
摘要
变压器已成为深度学习中的主导架构,在自然语言处理(NLP)、计算机视觉(CV)和科学计算等广泛的应用领域取得了无与伦比的成功。通过利用自注意力机制,变压器在性能上超越了传统的循环神经网络(RNN)和卷积神经网络(CNN)。然而,这种性能提升也带来了代价——高计算复杂性和庞大的内存需求,使得在传统硬件上高效部署变压器变得尤为困难。为了解决基于注意力的变压器日益增长的计算需求,人们越来越关注开发高效且高速的硬件加速器。硅光子技术作为一种有前景的替代方案,相比数字电子技术,它提供了高带宽和低延迟的计算能力,同时提升了整体的计算效率和能源效率。本研究介绍了ASTRA,这是首个利用随机计算原理为变压器神经网络设计的光学硬件加速器。ASTRA采用了新型的全范围光学随机乘法器和具有随机模拟计算功能的光电转换单元,能够高效处理基于注意力模型中的静态和动态张量计算。通过详细的性能分析,我们证明ASTRA相比最先进的变压器加速器至少实现了7.6倍的加速效果,并且能耗降低了1.3倍。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号