
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向分布式模拟存内计算系统的硬件友好型选择性权重更新方法研究
【字体: 大 中 小 】 时间:2025年08月15日 来源:Advanced Intelligent Systems 6.1
编辑推荐:
这篇综述提出了一种创新的选择性权重更新方法(GISU),通过基于卷积核映射的梯度重要性评估和交叉阵列梯度同步技术,将模拟存内计算(AiMC)系统中卷积神经网络(CNN)的训练脉冲生成次数降至平方根级别。该方法有效解决了6T1C突触阵列中权重共享导致的瓶颈问题,显著提升了分布式系统的训练效率(>99%准确率),同时降低器件非理想特性(如漂移、弛豫)对IGZO薄膜晶体管阵列的影响。
深度学习在计算机视觉等领域的广泛应用使得卷积神经网络(CNN)成为核心架构,但其大规模矩阵向量乘法(MVM)带来的能效问题亟待解决。模拟存内计算(AiMC)利用欧姆定律和基尔霍夫定律实现高效MVM,然而卷积层(CL)中过度的核权重共享导致计算瓶颈。尽管数据并行化和权重复制技术能加速推理,但模拟器件的非理想特性(如漂移、弛豫)和阵列间映射差异仍会引发性能退化。
研究团队创新性地提出梯度共享缓冲(GSB)机制,通过聚合来自不同区域输入的梯度向量(δ=?L/?o)实现跨阵列同步。针对传统方法中脉冲生成次数(BLT)与数据尺寸(RxRy)正比的缺陷,提出的梯度重要性选择性更新(GISU)定义梯度重要性(GI)为梯度向量元素绝对值之和,仅选择关键梯度进行更新,将BLT降至√(RxRy)水平。该方法在5×5 6T1C突触阵列(含IGZO薄膜晶体管)的棋盘分类任务中实现>99%准确率。
实验验证显示,GISU能有效抑制交叉阵列的寄生效应(如电容耦合),减轻并行写入干扰。通过减少脉冲生成次数,不仅降低器件承受的应力(提升IGZO晶体管可靠性),还缓解了周期-周期和器件-器件间的电导变异影响。在CIFAR-10/100和SVHN数据集上,该方法使ResNet和VGG架构的CL训练速度与全连接层(FCL)达到平衡。
该工作为分布式AiMC系统提供了一种硬件友好的训练范式,通过梯度重要性驱动的选择性更新策略,突破传统CNN在模拟阵列中的训练效率限制,为边缘智能设备的实时学习开辟新路径。
生物通微信公众号
知名企业招聘