基于贝叶斯突触不确定性的元塑性:神经网络中的持续学习与遗忘新机制
《Nature Communications》:Bayesian continual learning and forgetting in neural networks
【字体:
大
中
小
】
时间:2025年10月31日
来源:Nature Communications 15.7
编辑推荐:
本刊推荐一项突破性研究,针对人工智能长期面临的灾难性遗忘与灾难性记忆难题,研究团队基于贝叶斯推理框架提出了突触不确定性元塑性(MESU)方法。该方法通过动态调整参数学习率,在200个连续Permuted-MNIST任务中实现了91.3%的准确率,显著优于传统方法。其无任务边界的设计为现实场景下的持续学习提供了新范式,同时具备分布外检测能力,为类脑计算硬件实现奠定理论基础。
在人工智能领域,神经网络如同一个健忘的天才——学习新知识的同时往往会彻底遗忘旧技能,这种现象被称作"灾难性遗忘"。更令人困扰的是,当网络被过度约束以保护旧知识时,又会陷入"灾难性记忆"的困境,失去学习新任务的能力。这一根本性矛盾一直制约着人工智能系统向人类般持续学习的能力发展。
有趣的是,人类大脑中的突触却能优雅地平衡记忆与遗忘。近年神经科学提出大胆假说:生物突触可能通过维持权重值的"误差条"来实现贝叶斯推理,根据确信度调整学习速率。这一机制与"元塑性"概念不谋而合——突触根据任务重要性自适应调整其可塑性水平。
受到这一生物学启示,巴黎萨克大学等机构的研究团队在《Nature Communications》发表了开创性研究,提出了名为"基于突触不确定性的元塑性"(MESU)的新方法。该方法首次将贝叶斯持续学习与受控遗忘机制相结合,在不需要明确任务边界的情况下,实现了记忆保持与学习灵活性的最佳平衡。
研究团队采用变分推断框架,为每个网络参数维持高斯分布,其中均值代表权重值,标准差表征不确定性。核心创新在于引入了截断后验分布,仅保留最近N个任务的信息。通过最小化变分自由能目标函数,推导出简洁的更新规则:Δμt = σt-12·???t/?μ,Δσt = σt-12·???t/?σ。这一规则使不确定参数快速适应新知识,而确定参数保持稳定,实现了元塑性调节。
在技术方法上,研究通过域增量动物分类、Permuted-MNIST和CIFAR系列数据集验证MESU性能。采用贝叶斯神经网络架构,使用重参数化技巧计算梯度,比较了MESU与随机梯度下降(SGD)、弹性权重巩固(EWC)、突触智能(SI)等方法的表现。所有实验均进行多次随机种子测试,确保结果可靠性。
贝叶斯持续学习与遗忘:自由能 formulation
研究团队建立了基于变分自由能的目标函数??t = E[log p(??t|ω)] - DKL[qθt(ω)∥qθt-1(ω)] + E[log p(??t-N-1|ω)]。该公式明确分离了学习项(适应新任务)与遗忘项(消除旧任务影响)。通过假设各数据集边际似然相等,推导出封闭形式的更新规则,使模型在连续数据流中保持容量平衡。
理论分析表明,MESU与牛顿法存在深刻联系。当学习率γ=1/N时,更新规则变为μt = μt-1 - (1/N)HD-1(μ)???/?μ,其中HD(μ)为赫斯矩阵对角线。这解释了σ2收敛至曲率倒数的原因,与EWC和SI等方法共享参数重要性评估机制,但无需任务边界。
在ImageNet级动物分类任务中,MESU表现出卓越的持续学习能力。学习三个任务后,贝叶斯网络在首任务保持93%准确率,对未见过任务泛化能力达74%,而确定性模型分别降至72%和65%。同时,MESU的认知不确定性成功区分鲸类分布外样本,AUROC接近1.0,显著优于仅依赖偶然不确定性的确定性网络。
在长序列学习场景下,MESU在无任务边界条件下实现91.3%的准确率,超过EWC Online(88.5%)和SI(87.0%)。记忆刚性韧性指标显示,FOO-VB Diagonal因无限记忆窗口出现灾难性记忆,准确率降至70%,而MESU保持最佳平衡。网络宽度消融实验表明,容量越大,最优记忆窗口N值越高,宽网络可受益于20任务以上的窗口设置。
在MNIST连续训练1000轮后,FOO-VB Diagonal因权重方差坍塌导致认知不确定性消失,分布外检测能力显著下降。而MESU通过有限记忆窗口维持参数分布可变性,ROC AUC持续接近1.0。这一现象验证了受控遗忘对保持不确定性估计的重要性。
在深度卷积网络测试中,MESU在单分割任务设置下全面超越EWC、SI和Adam。当任务被细分为16个交叉分割时,EWC和SI因依赖明确任务边界而性能急剧下降,Adam虽有所提升但仍存在遗忘,而MESU保持稳定优势,准确率领先2-17个百分点。这证明了其无边界设计的实际价值。
这项研究通过理论创新与实验验证,解决了持续学习领域的三大核心挑战。MESU框架将贝叶斯推理与受控遗忘有机结合,在生物学合理性与计算效率间取得平衡。其与生物突触模型的相似性为类脑计算提供了新视角,而基于赫斯矩阵的解释建立了与二阶优化方法的理论桥梁。研究还指出,未来结合记忆回放策略与专用硬件实现(如忆阻器交叉阵列)可进一步拓展应用边界。这项工作为开发真正具备持续学习能力的人工智能系统奠定了重要基础,在自动驾驶、医疗诊断等需要终身学习的领域具有广阔应用前景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号