基于对数求和正则化与改进动量法的受限玻尔兹曼机高效混合算法研究

【字体: 时间:2025年06月04日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对深度学习中受限玻尔兹曼机(RBM)易过拟合、计算效率低的问题,研究人员提出融合对数求和正则化(log-sum)与改进动量法(MMA)的混合算法。通过梯度近似优化、稀疏表示自适应学习及分阶段动量加速,在MNIST等数据集上实现99.01%的识别准确率,图像去噪效果提升3.4%,为人工智能工程应用提供新范式。

  

在深度学习领域,受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)作为强大的无监督特征提取模型,通过可见层与隐藏层的信息交互学习数据概率分布,其堆叠形成的深度信念网络(Deep Belief Network, DBN)在空气质量预测、医疗诊断等领域展现出革命性潜力。然而,深度架构存在两大痛点:一是层数增加易引发过拟合,二是计算成本呈指数级增长。现有改进方案如对比散度(CD)、稀疏RBM等虽部分缓解问题,但梯度近似精度不足、动量加速策略单一等问题仍制约模型性能。

针对这一挑战,由教育部人文社科规划基金支持的研究团队提出创新性解决方案——融合对数求和正则化(log-sum)与改进动量法(Modified Momentum Algorithm, MMA)的RBM混合算法。该研究发表于《Engineering Applications of Artificial Intelligence》,通过三阶段技术革新:首先改进梯度近似算法,直接计算对数似然梯度第一项以提升精度;其次引入log-sum正则实现隐藏单元稀疏性自适应学习;最后在预训练阶段采用快速上升动量、微调阶段改用缓慢下降动量,形成差异化加速策略。

关键技术方法包括:基于改进偏置的梯度近似算法、Gibbs采样估计RBM分布、分阶段动量参数更新策略,实验采用MNIST手写数字库、CMU-PIE和Extended Yale B人脸库作为测试数据集。

研究结果部分:
图像识别实验
在MNIST、CMU-PIE和Extended Yale B数据集上分别达到99.01%、98.93%和98.33%的识别准确率,较现有最优方法提升至少0.01%。Mini-batch策略配合Intel i7处理器实现高效计算,验证算法在分类性能与计算效率的双重优势。

图像去噪实验
相比去噪卷积神经网络(DnCNN),该算法在自然图像、模拟地震数据和真实地震数据中,对随机噪声(σ=0.1)的去除效果提升约3.4%,证明其在工程领域的泛化能力。

结论与意义
该研究开创性地将log-sum正则与改进动量法结合,突破传统RBM训练瓶颈:梯度近似改进使参数更新更贴近真实分布;稀疏正则化增强模型泛化能力;分阶段动量策略较传统CM/NM方法加速收敛20%。研究成果不仅为深度网络训练提供新范式,更在医疗影像分析、地震勘探等工程场景展现出应用潜力。作者团队特别指出,算法对隐藏层偏置参数的更新规则优化是关键创新点,未来可进一步探索其在Transformer等新兴架构中的迁移价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号