基于多算法堆叠集成模型的玻璃折射率预测研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月03日 来源：Journal of Non-Crystalline Solids 3.2

编辑推荐：

　　针对单一机器学习算法预测玻璃折射率存在模型偏差的问题，研究人员创新性地采用堆叠集成（stacking）方法，结合线性回归（LR）、随机森林（RF）等5种算法构建多模型融合框架。结果表明，该模型将RMSE降低3.6%-38%，并通过SHAP值解析特征贡献度，为氧化物玻璃设计提供高效精准的预测工具。

在光学材料领域，玻璃折射率的精准预测一直是制约新型光学玻璃研发的瓶颈。传统试错法不仅耗费大量资源，且难以应对氧化物组分间复杂的非线性关系。尽管机器学习（ML）已在密度、弹性模量等性能预测中展现潜力，但单一算法模型对折射率的预测仍存在显著偏差。这一困境促使研究人员探索更强大的集成学习策略。

中国的研究团队在《Journal of Non-Crystalline Solids》发表的研究中，首次将多算法堆叠集成模型应用于玻璃折射率预测。研究从SciGlass数据库获取50,827组氧化物玻璃数据，通过99%-101%组分筛选和1.1-2.3折射率范围限定，最终构建含2663样本的高质量数据集。

关键技术包括：1）采用Spearman系数分析特征-目标变量相关性；2）构建含线性回归（LR）、XGBoost、随机森林（RF）等5种基模型的堆叠架构；3）应用SHAP（Shapley Additive Explanations）可解释性分析量化特征贡献；4）以均方根误差（RMSE）为核心评估指标对比单模型与集成模型性能。

【数据收集】
基于MIT开发的SciGlass数据库，筛选与N-BK7光学玻璃组分相似的K9L玻璃体系，重点分析SiO₂、K₂O等关键氧化物占比。

【数据整理】
通过剔除缺失值及组分总和超出99%-101%的异常数据，结合归一化处理确保数据可靠性，最终获得涵盖多元氧化物的标准化数据集。

【结论】
堆叠模型较单模型RMSE降低最高达38%，SHAP分析揭示B₂O₃-La₂O₃-Ta₂O₅体系对折射率影响显著。该研究为突破传统试错法局限提供新范式，代码已开源共享。

这项研究的意义在于：首次证实堆叠集成策略在玻璃性能预测中的优越性，通过多模型优势互补有效克服单算法偏差。特征可解释性分析为组分优化提供理论依据，其方法论可扩展至其他复杂材料体系预测，加速新型光学材料开发进程。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号