基于先验引导深度高斯过程的高熵合金性能精准预测与不确定性建模
《npj Computational Materials》:Accurate and uncertainty-aware multi-task prediction of HEA properties using prior-guided deep Gaussian processes
【字体:
大
中
小
】
时间:2025年10月17日
来源:npj Computational Materials 11.9
编辑推荐:
本研究针对高熵合金(HEA)设计中数据稀疏、异方差及多任务关联的挑战,系统评估了深度高斯过程(DGP)等四种代理模型在Al-Co-Cr-Cu-Fe-Mn-Ni-V八元体系中的预测性能。结果表明,融合编码器-解码器先验的DGP模型(HDGP P-All)通过有效捕获性能间关联性和整合先验知识,在屈服强度(YS)、极限抗拉强度(UTS)等关键机械性能预测中展现出最优精度和不确定性量化能力,为数据驱动的高效材料设计提供了可靠工具。
高熵合金(High-Entropy Alloys, HEAs)作为具有五种及以上主元的多组元合金体系,因其独特的构型熵效应和优异的力学性能成为材料领域的研究热点。然而,其巨大的成分设计空间与复杂的成分-性能关系,使得传统实验试错方法面临高昂成本与漫长周期挑战。尤其当实验数据稀疏、存在异方差性(heteroscedasticity)且多属性间存在关联时,如何构建能够精准预测性能并量化不确定性的代理模型(surrogate model)成为加速合金设计的关键。
针对这一难题,德州农工大学Sk Md Ahnaf Akif Alvi研究团队在《npj Computational Materials》发表了系统性研究,通过对四种主流代理模型——传统高斯过程(cGP)、深度高斯过程(DGP)、编码器-解码器神经网络(encoder-decoder)和极端梯度提升(XGBoost)——在Al-Co-Cr-Cu-Fe-Mn-Ni-V八元高熵合金体系中的性能对比,揭示了融合先验知识的深度高斯过程模型在处理多任务、异方差和不完整数据方面的显著优势。
研究人员创新性地采用编码器-解码器网络生成先验知识,并将其注入DGP的层次化结构中(称为HDGP P-All模型),通过残差学习策略增强模型在数据稀疏区域的预测鲁棒性。研究依托BIRDSHOT数据集(包含147种合金成分的实验与计算数据),评估了模型对屈服强度(YS)、极限抗拉强度(UTS)、延伸率(Elongation)、硬度(Hardness)等核心力学性能及堆垛层错能(SFE)、价电子浓度(VEC)等计算描述符的预测能力。关键技术方法包括:深度高斯过程的变分推断训练、多任务相关性建模、贝叶斯优化驱动的实验设计、以及基于SHAP(SHapley Additive exPlanations)的特征重要性分析。数据集整合了实验测量(纳米压痕、拉伸测试、分裂霍普金森杆动态压缩等)与计算数据(第一性原理机器学习预测的SFE、Curtin-Varvenne固溶强化模型计算的YS等)。
模型性能比较
通过五重随机划分的测试集验证,HDGP P-All模型在绝大多数关键性能预测中均取得最优指标(最低RMSE、SMAPE和最高R2、Spearman等级相关系数)。其成功归因于:1)层次化结构有效捕获了性能间耦合关系(如YS-UTS-硬度的正相关、与延伸率的负相关);2)先验注入避免了传统GP在未见区域默认常数预测的缺陷;3)辅助任务(如VEC、SFE)通过多任务学习提升了主任务预测精度。相比之下,XGBoost虽在部分计算描述符预测中表现良好,但缺乏不确定性量化能力;cGP因无法建模任务相关性而性能受限;编码器-解码器模型虽具竞争力,但参数过多易过拟合且无法提供不确定性估计。
特征重要性解析
通过SHAP分析揭示了元素成分对性能的影响规律:Al和V对强度类属性(YS、UTS、硬度)呈现最显著的正向贡献;Cr和Cu对延伸率等塑性指标具有积极影响;Mn和Fe则表现出属性依赖的调节作用。这些发现与冶金学原理高度一致,证实了模型预测的物理合理性,并为针对性合金设计提供了元素调控策略。
讨论与结论
该研究证明了深度高斯过程在材料信息学中的巨大潜力:其通过层次化贝叶斯框架整合先验知识与多任务学习,有效解决了实际材料数据集中的异方差、异位点和数据缺失问题。HDGP P-All模型优异的排名能力(Spearman相关系数>0.8)和校准的不确定性估计,使其特别适用于贝叶斯优化引导的实验设计,能够在少量采样(<0.2%设计空间)下快速定位帕累托最优成分。未来工作需进一步优化计算效率并拓展域特定先验的集成方式,以推动此类先进代理模型在更广泛材料体系中的应用。
本研究为复杂合金体系的数据驱动设计建立了新范式,通过有机结合物理引导的机器学习与不确定性量化,为实现高效、可靠的材料发现提供了关键技术支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号