
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于相变存储器的内存计算与学习-学习技术实现快速自适应人工智能
【字体: 大 中 小 】 时间:2025年02月02日 来源:Nature Communications
编辑推荐:
为解决边缘AI系统在低功耗、快速自适应方面的挑战,研究人员将学习-学习(L2L)技术与相变存储器(PCM)基神经形态硬件(NMHW)相结合,开发出能通过少量参数更新快速适应新任务的智能系统。该研究在图像分类和机器人控制两类任务中验证了方法的有效性,结果表明无需精确硬件模型即可实现与软件相当的性能,为边缘智能设备提供了高效解决方案。
在人工智能技术飞速发展的今天,传统深度学习模型面临着巨大的能耗挑战,尤其是在边缘计算场景中。这些模型通常需要大量数据和计算资源进行微调,难以满足移动设备、自主机器人和物联网设备对低功耗、快速自适应的需求。与此同时,人类大脑却展现出惊人的快速学习能力,能够通过迁移相关知识轻松适应新任务。这种差异促使科学家们探索更接近生物学习机制的新型计算范式。
针对这一挑战,来自格拉茨技术大学、IBM研究院等机构的研究团队在《Nature Communications》发表了一项突破性研究。该研究创新性地将学习-学习(Learning-to-learn, L2L)这一模仿人类学习策略的技术,与基于相变存储器(Phase-change memory, PCM)的神经形态硬件(Neuromorphic hardware, NMHW)相结合,开发出能够快速适应新任务的人工智能系统。
研究采用了两种关键技术方法:一是模型无关元学习(Model-agnostic meta-learning, MAML),用于训练卷积神经网络(CNN)完成小样本图像分类;二是自然电子传播(natural e-prop)算法,训练脉冲神经网络(SNN)控制机械臂轨迹。所有实验均在配备256×256交叉阵列的PCM硬件平台上进行,通过量化权重和硬件仿真验证性能。
学习-学习与神经形态硬件
研究首先阐述了L2L的双阶段机制:在元训练阶段通过软件优化网络初始参数,使其能够快速适应任务家族中的任何任务;在适应阶段仅需更新少量参数即可完成特定任务学习。这种机制与PCM基NMHW的特性完美契合,既能保持非易失性存储优势,又能通过简单学习规则实现高效更新。
基于PCM神经形态硬件的小样本图像分类
在Omniglot数据集上的5-way 5-shot分类实验中,仅更新CNN最后密集层(占总参数<1%)的1120个PCM器件,经过4次梯度更新即可达到与32位软件模型相当的分类准确率(约90%)。值得注意的是,使用4位量化权重进行元训练并未降低硬件部署后的性能,证明无需精确硬件模型也能获得良好效果。在更复杂的CIFAR100-FS数据集上,通过硬件仿真器(EM-NMHW)验证了类似结论。
生物启发神经网络的机器人轨迹快速在线学习
通过自然e-prop算法,研究构建了由学习信号生成器(LSG)和学员网络组成的SNN系统。元训练后的网络仅需单次权重更新即可生成机械臂目标轨迹所需的角速度命令。实验显示,32位软件模型与NMHW实现的控制轨迹均方根误差分别为(0.0381±0.0070) rad/s和(0.1274±0.0811) rad/s,在真实ED-Scorbot机械臂上成功复现了目标轨迹。
讨论与结论
该研究突破了传统神经形态硬件仅适用于推理任务的局限,通过L2L实现了高效的在线学习能力。两个关键发现尤为突出:一是元训练对硬件非理想特性表现出显著鲁棒性,仅需简单软件模拟即可获得良好硬件部署效果;二是PCM器件的低精度特性未显著影响SNN等复杂动态网络的性能。这种"软件元训练+硬件微调"的范式,为开发新一代边缘智能设备提供了可行路径。未来,将模型基L2L方法与内存计算架构结合,有望进一步拓展神经形态硬件的应用边界。
研究还揭示了生物学启示的重要意义:自然e-prop算法通过模拟大脑中学习信号与资格迹的协同机制,实现了媲美生物学习效率的单次更新能力。这种融合神经科学原理与先进硬件技术的跨学科方法,为开发更接近生物智能的人工系统指明了方向。论文最后强调,随着NMHW矩阵规模的持续扩大,这项技术将为更复杂网络架构的快速学习开辟新的可能性。
生物通微信公众号
知名企业招聘