
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于忆阻器片上系统的融合网络实现实时信号处理:突破冯·诺依曼瓶颈的高效能计算新范式
【字体: 大 中 小 】 时间:2025年07月26日 来源:SCIENCE ADVANCES 11.7
编辑推荐:
针对冯·诺依曼架构在数据密集型信号处理任务中的能效瓶颈,研究人员开发了基于忆阻器(Memristor)的片上系统(SoC),通过融合离散傅里叶变换(DFT)和卷积神经网络(CNN)的混合网络,实现了33.49 dB峰值信噪比的音频频谱分析和94.72%准确率的语音分类,其能效较传统GPU提升49倍,为边缘计算提供了革新性解决方案。
随着人工智能和物联网技术的快速发展,实时信号处理在语音识别、医疗影像分析等领域的应用面临严峻挑战。传统数字系统受限于冯·诺依曼架构的数据搬运瓶颈,其高能耗和低效率问题日益凸显。特别是在边缘设备等资源受限场景中,如何实现高能效的实时计算成为制约技术发展的关键难题。
为突破这一技术瓶颈,来自TetraMem的研究团队在《SCIENCE ADVANCES》发表创新性研究,开发出基于忆阻器(Memristor)的片上系统(SoC)。该系统通过将离散傅里叶变换(DFT)与卷积神经网络(CNN)融合为统一计算网络,在128×128忆阻器交叉阵列上实现了33.49 dB峰值信噪比(PSNR)的音频实时频谱分析,并以94.72%的准确率完成AudioMNIST数据集分类,其能效较NVIDIA A100 GPU提升49倍。
研究团队采用三项核心技术:1)定制化DFT矩阵映射技术,将复数运算分解为实部/虚部分量处理;2)1T1R(单晶体管单忆阻器)阵列集成工艺,通过180nm制程实现256×256规模忆阻器阵列;3)混合信号处理架构,采用正负分量分离计算策略解决8位DAC输入限制。
研究结果部分显示:
DFT和卷积操作的VMM实现:通过将DFT矩阵元素编程为忆阻器电导值,实现输入信号与DFT核的模拟向量矩阵乘法(VMM)运算,编程误差仅3.94%。
SoC实时音频处理:在6.4kHz采样率下,将20ms音频切片转换为频谱图,硬件结果与软件计算PSNR达33.49 dB。
视频实时边缘检测:采用Sobel算子对64×78分辨率视频帧进行卷积运算,边缘检测PSNR达30.43 dB。
融合网络分类性能:DFT+CNN五层网络在语音数字识别任务中达到94.72%准确率,核心阵列能效达102 TOP/(s·W)。
这项研究的突破性在于首次在忆阻器SoC上实现了信号处理与神经网络的硬件级融合,通过模拟存内计算彻底规避了数据搬运能耗。尽管当前系统仍受限于数字接口带宽和阵列规模,但研究证实了忆阻器技术在实时信号处理领域的巨大潜力,为开发下一代边缘智能设备提供了关键技术路径。该成果有望推动医疗监护、自动驾驶等低延迟应用的发展,其混合计算架构设计思路对新型计算范式研究具有重要启示意义。
生物通微信公众号
知名企业招聘