
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多算法堆叠集成模型的玻璃折射率预测研究
【字体: 大 中 小 】 时间:2025年07月03日 来源:Journal of Non-Crystalline Solids 3.2
编辑推荐:
针对单一机器学习算法预测玻璃折射率存在模型偏差的问题,研究人员创新性地采用堆叠集成(stacking)方法,结合线性回归(LR)、随机森林(RF)等5种算法构建多模型融合框架。结果表明,该模型将RMSE降低3.6%-38%,并通过SHAP值解析特征贡献度,为氧化物玻璃设计提供高效精准的预测工具。
在光学材料领域,玻璃折射率的精准预测一直是制约新型光学玻璃研发的瓶颈。传统试错法不仅耗费大量资源,且难以应对氧化物组分间复杂的非线性关系。尽管机器学习(ML)已在密度、弹性模量等性能预测中展现潜力,但单一算法模型对折射率的预测仍存在显著偏差。这一困境促使研究人员探索更强大的集成学习策略。
中国的研究团队在《Journal of Non-Crystalline Solids》发表的研究中,首次将多算法堆叠集成模型应用于玻璃折射率预测。研究从SciGlass数据库获取50,827组氧化物玻璃数据,通过99%-101%组分筛选和1.1-2.3折射率范围限定,最终构建含2663样本的高质量数据集。
关键技术包括:1)采用Spearman系数分析特征-目标变量相关性;2)构建含线性回归(LR)、XGBoost、随机森林(RF)等5种基模型的堆叠架构;3)应用SHAP(Shapley Additive Explanations)可解释性分析量化特征贡献;4)以均方根误差(RMSE)为核心评估指标对比单模型与集成模型性能。
【数据收集】
基于MIT开发的SciGlass数据库,筛选与N-BK7光学玻璃组分相似的K9L玻璃体系,重点分析SiO2、K2O等关键氧化物占比。
【数据整理】
通过剔除缺失值及组分总和超出99%-101%的异常数据,结合归一化处理确保数据可靠性,最终获得涵盖多元氧化物的标准化数据集。
【结论】
堆叠模型较单模型RMSE降低最高达38%,SHAP分析揭示B2O3-La2O3-Ta2O5体系对折射率影响显著。该研究为突破传统试错法局限提供新范式,代码已开源共享。
这项研究的意义在于:首次证实堆叠集成策略在玻璃性能预测中的优越性,通过多模型优势互补有效克服单算法偏差。特征可解释性分析为组分优化提供理论依据,其方法论可扩展至其他复杂材料体系预测,加速新型光学材料开发进程。
生物通微信公众号
知名企业招聘