一种混合精度异构 CIM 人工智能边缘处理器:突破传统权衡,实现高效精准计算
【字体:
大
中
小
】
时间:2025年03月06日
来源:Nature 50
编辑推荐:
为满足人工智能边缘设备需求,研究人员开展混合精度异构 CIM 处理器研究,成果高效、低精度损失且响应快。
人工智能(AI)边缘设备对高精度、高能效计算,大尺寸片上模型存储,快速唤醒响应时间以及经济高效且适用于代工厂的解决方案有着迫切需求。浮点(FP)计算能提供超越整数(INT)格式的精度,但代价是更高的功耗和存储开销。多级单元(MLC)忆阻器计算内存(CIM)具备紧凑的非易失性存储和高能效计算的优势,然而,由于工艺变化,它容易出现精度损失的问题。数字静态随机存取存储器(SRAM) - CIM 虽能实现无损计算,可因其位单元面积较大导致存储量较低,并且在推理过程中需要加载模型。因此,传统采用同质 CIM 架构和计算格式的方法,在效率、存储、唤醒延迟和推理精度之间存在权衡取舍。此次研究提出了一种混合精度异构 CIM 人工智能边缘处理器,它能够基于对误差的敏感性,在片上 CIM 架构(即忆阻器 - CIM、SRAM - CIM 和微型数字单元)和计算数值格式(INT 和 FP)之间,对网络层进行层粒度 / 内核粒度的划分。这种层粒度 / 内核粒度的灵活性,使得在硬件层面的二维设计空间内能够实现同步优化。该硬件在实验中展现出高能效(针对 CIFAR - 100 数据集的 ResNet - 20 模型,能效达到 40.91 TFLOPS W-1;针对 ImageNet 数据集的 MobileNet - v2 模型,能效为 28.63 TFLOPS W-1)、低精度降解(针对 CIFAR - 100 数据集的 ResNet - 20 模型和针对 ImageNet 数据集的 MobilNet - v2 模型,精度降解均小于 0.45%)以及快速的唤醒响应时间(373.52 μs)。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号