
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Langevin SDE的指数驯化优化器ExpTamed:提升深度学习稳定性和精度的新方法
【字体: 大 中 小 】 时间:2025年07月19日 来源:Neurocomputing 5.5
编辑推荐:
针对深度学习优化中梯度爆炸、收敛不稳定等问题,研究人员提出基于Langevin SDE的新型指数驯化优化器ExpTamed。通过动态调节梯度与噪声项的指数驯化机制,在CIFAR-10/Tiny-ImageNet等数据集上实现0.86-4.46%的Top-1准确率提升,为复杂非凸优化问题提供更稳定的解决方案。
在深度学习领域,优化算法的性能直接影响模型训练的成败。尽管Adam、RMSProp等自适应优化器已成为主流,但梯度爆炸、陷入局部极小值等问题仍困扰着复杂网络的训练。尤其当面对非凸优化问题时,传统方法往往难以平衡探索与开发的矛盾。与此同时,基于Langevin随机微分方程(SDE)的优化方法虽能通过噪声注入帮助逃离局部最优,却常因梯度漂移项缺乏全局Lipschitz连续性导致数值不稳定。这些挑战促使研究人员不断探索更鲁棒的优化策略。
针对这一难题,土耳其科学技术研究理事会(TUBITAK)资助、埃斯基谢希尔技术大学数学系Utku Erdo?an团队在《Neurocomputing》发表研究,提出名为ExpTamed的新型指数驯化优化器。该工作创新性地将SGLD(随机梯度Langevin动力学)与双因子指数驯化机制结合,通过分别调节梯度项和噪声项的驯化强度,在CIFAR-10、Tiny-ImageNet等基准测试中显著提升模型性能。
研究主要采用三类技术方法:1) 基于Langevin SDE的数值离散化框架,构建含指数驯化项的优化器更新规则;2) 多架构验证策略,在ResNet等CNN模型上对比ExpTamed与Adam等优化器的RMSE(均方根误差)和分类准确率;3) 蒙特卡洛模拟评估不同taming方法在短时域内的稳定性差异。
Proposed Method: ExpTamed
通过改进TheoPoula优化器的单因子驯化设计,ExpTamed引入分离的梯度驯化因子(1+e-β|?L|)-1和噪声驯化因子(1+|?L|2)-1/2,理论分析证明其能有效控制超线性增长梯度。数值实验显示,相比传统taming方法(5)和隐式Euler-Maruyama,ExpTamed在RMSE指标上降低17-29%。
Comparison of tamed SDE solvers
在Caltech256数据集测试中,ExpTamed的Kappa系数提升0.12,验证其缓解梯度冲突的能力。特别值得注意的是,在无学习率调度情况下,Tiny-ImageNet上的Top-1准确率较Adam提高4.46个百分点,证明该方法对大规模稀疏梯度问题的适应性。
Conclusion
研究结论指出,ExpTamed的双因子驯化机制通过动态调节噪声强度与梯度幅度的比例关系,在保持SGLD逃逸局部极小优势的同时,解决了传统方法因非Lipschitz连续导致的数值发散问题。该成果不仅为深度学习优化提供新工具,其指数驯化思想还可推广至金融数学、计算物理等领域的随机系统模拟。
讨论部分强调,ExpTamed在CNN架构上的成功验证了"适度噪声有助于非凸优化"的假设,但针对Transformer等新架构的适配仍需探索。作者指出,未来工作将聚焦于自适应驯化系数的理论分析,以及与其他正则化技术(如权重衰减)的协同效应研究。
生物通微信公众号
知名企业招聘