基于多算法堆叠集成模型的玻璃折射率预测研究

【字体: 时间:2025年07月03日 来源:Journal of Non-Crystalline Solids 3.2

编辑推荐:

  针对单一机器学习算法预测玻璃折射率存在模型偏差的问题,研究人员创新性地采用堆叠集成(stacking)方法,结合线性回归(LR)、随机森林(RF)等5种算法构建多模型融合框架。结果表明,该模型将RMSE降低3.6%-38%,并通过SHAP值解析特征贡献度,为氧化物玻璃设计提供高效精准的预测工具。

  

在光学材料领域,玻璃折射率的精准预测一直是制约新型光学玻璃研发的瓶颈。传统试错法不仅耗费大量资源,且难以应对氧化物组分间复杂的非线性关系。尽管机器学习(ML)已在密度、弹性模量等性能预测中展现潜力,但单一算法模型对折射率的预测仍存在显著偏差。这一困境促使研究人员探索更强大的集成学习策略。

中国的研究团队在《Journal of Non-Crystalline Solids》发表的研究中,首次将多算法堆叠集成模型应用于玻璃折射率预测。研究从SciGlass数据库获取50,827组氧化物玻璃数据,通过99%-101%组分筛选和1.1-2.3折射率范围限定,最终构建含2663样本的高质量数据集。

关键技术包括:1)采用Spearman系数分析特征-目标变量相关性;2)构建含线性回归(LR)、XGBoost、随机森林(RF)等5种基模型的堆叠架构;3)应用SHAP(Shapley Additive Explanations)可解释性分析量化特征贡献;4)以均方根误差(RMSE)为核心评估指标对比单模型与集成模型性能。

【数据收集】
基于MIT开发的SciGlass数据库,筛选与N-BK7光学玻璃组分相似的K9L玻璃体系,重点分析SiO2、K2O等关键氧化物占比。

【数据整理】
通过剔除缺失值及组分总和超出99%-101%的异常数据,结合归一化处理确保数据可靠性,最终获得涵盖多元氧化物的标准化数据集。

【结论】
堆叠模型较单模型RMSE降低最高达38%,SHAP分析揭示B2O3-La2O3-Ta2O5体系对折射率影响显著。该研究为突破传统试错法局限提供新范式,代码已开源共享。

这项研究的意义在于:首次证实堆叠集成策略在玻璃性能预测中的优越性,通过多模型优势互补有效克服单算法偏差。特征可解释性分析为组分优化提供理论依据,其方法论可扩展至其他复杂材料体系预测,加速新型光学材料开发进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号