针对面积效率高的10T2C电容式SRAM设计,优化了贝叶斯非对称螺母夹式量化神经网络,并采用了可重构SAR ADC
《Neurocomputing》:Optimized Bayesian Asymmetric Nutcracker Quantized Neural Networks for Area-Efficient 10T2C Capacitive SRAM Design with Reconfigurable SAR ADCs
【字体:
大
中
小
】
时间:2025年10月28日
来源:Neurocomputing 6.5
编辑推荐:
电容式SRAM架构在神经计算内存(CIM)中的应用,通过集成DAC、可重构SAR ADC和贝叶斯量化优化算法,实现能效比130.0 TOPS/W,面积效率4333.3 TOPS/W/mm2,解决传统DAC/ADC带来的面积和功耗问题,适用于可穿戴健康监测等边缘计算场景。
在当前人工智能技术迅速发展的背景下,神经网络计算设备的加速成为了一个重要的研究方向。特别是在资源受限的应用场景中,如可穿戴健康监测系统,对计算效率和功耗的要求尤为突出。为了满足这些需求,基于电容SRAM的类脑计算系统(A-CIM)展现出了极大的潜力。这类系统利用了SRAM的非易失性、宽泛的可编程范围以及相对低廉的制造成本,为高效处理神经网络任务提供了新的思路。
然而,尽管A-CIM在某些方面具有优势,其在构建复杂模型,如深度神经网络(DNN)时仍然面临挑战。这是因为A-CIM系统本质上具有强烈的模拟特性,这使得在模拟电路设计中实现高精度计算变得困难。特别是对于需要高计算信号噪声比(CSNR)的应用,如Transformer模型,现有技术在处理这类任务时存在一定的局限性。为了解决这些问题,研究人员提出了一种新的架构,即嵌入式电容SRAM-CIM系统,结合了可重构的SAR ADC(逐次逼近寄存器模数转换器)技术,以提高系统的精度和能效。
在传统的A-CIM架构中,通常需要外部的DAC(数模转换器)和ADC(模数转换器)接口,这不仅增加了芯片面积,也带来了额外的功耗。DAC设计通常采用电阻或电容梯形结构,这些结构在芯片上占用大量空间,并且需要较高的功耗。而ADC的资源需求则随着多比特权重处理的增加而上升,这限制了系统在不同应用场景下的可扩展性。为了解决这些问题,本文提出了一种优化的贝叶斯不对称坚果钳量化神经网络(OBAN-QNN)架构,结合了10T2C电容SRAM和可重构的SAR ADC,以实现更高的能效和更好的可扩展性。
本文的核心创新在于将DAC功能直接嵌入到SRAM单元中,并结合可重构的SAR ADC设计,形成一个统一的架构。这种设计不仅减少了对外部DAC的需求,还显著降低了芯片面积和功耗。此外,通过贝叶斯不对称量化方法,并利用坚果钳优化算法(NOA)进行硬件指定,系统能够在处理过程中动态调整量化级别,以适应工艺变化和信号噪声,从而提高计算精度和适应性。
在具体的实现上,10T2C电容SRAM单元的设计采用了紧凑的结构,以减少外部DAC的使用,提高整体能效。而SAR ADC则通过分段设计和动态调整,确保在处理不同数据负载时能够保持高精度和低功耗。此外,为了提高系统的适应性和可扩展性,本文提出了一种模块化的架构,使得该设计不仅适用于可穿戴健康监测系统,还能够应用于其他神经网络和信号处理任务。
在实验验证方面,本文基于28纳米CMOS工艺实现了该架构,并在128 × 128的阵列上进行了测试。实验结果表明,该架构在能效方面达到了130 TOPS/W的峰值,同时具备108.1 GOPS的吞吐量,以及高达4333.3 TOPS/W/mm2的面积效率。这些性能指标表明,该架构在资源受限的应用中具有显著的优势。
在文献综述部分,本文回顾了相关领域的研究进展,指出虽然已有研究探讨了将DAC功能嵌入到SRAM单元中、使用可重构的SAR ADC以及贝叶斯量化方法,但这些方法通常被单独研究和应用。本文的创新在于将这些方法在同一个10T2C电容SRAM-CIM架构中进行协同优化,从而实现更高的能效和更好的可扩展性。
在方法论部分,本文详细描述了OBAN-QNN架构的实现过程。该架构结合了贝叶斯量化方法和坚果钳优化算法,以提高计算精度和效率。同时,通过将DAC功能直接嵌入到SRAM单元中,减少了对传统DAC接口的依赖,从而降低了面积和功耗。此外,SAR ADC的设计采用了动态调整机制,以适应不同的数据负载需求,进一步提高了系统的灵活性和适应性。
在结果与讨论部分,本文展示了该架构在不同应用场景下的性能表现。实验结果表明,该架构在处理多比特输入和权重时,能够有效提高运算可靠性,同时保持较低的复杂度。此外,该架构在可穿戴健康监测系统中的应用,能够满足高能效和紧凑设计的需求,为边缘计算和物联网设备提供了有力支持。
最后,在结论部分,本文总结了该架构的优势和应用前景。通过将DAC功能嵌入到SRAM单元中,结合可重构的SAR ADC设计和贝叶斯量化方法,该架构在能效和可扩展性方面表现出色,能够有效应对当前神经网络计算中的挑战。同时,该架构具备良好的适应性,可以在多种应用场景中发挥作用,为未来人工智能设备的发展提供了新的方向。
通过上述研究,本文不仅提出了一个创新的架构,还验证了其在实际应用中的可行性。该架构的成功实施表明,通过优化设计和协同创新,可以在资源受限的环境中实现高效、低功耗的神经网络计算。未来的研究可以进一步探索该架构在更多应用场景中的潜力,以及如何通过更先进的工艺和设计技术进一步提高其性能。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号