
-
生物通官微
陪你抓住生命科技
跳动的脉搏
通过不确定性采样和基于符号分类的参数发现方法,在高熵合金中实现相位预测
《npj Computational Materials》:Phase prediction in high-entropy alloys through uncertainty sampling and symbolic classification-based parameter discovery
【字体: 大 中 小 】 时间:2026年06月12日 来源:npj Computational Materials 11.9
编辑推荐:
摘要数据不平衡是数据驱动方法在材料数据建模中面临的关键挑战。在本研究中,开发了主动学习模型来缓解高熵合金(HEAs)相选择过程中的数据不平衡问题。基于包含149个特征的三组数据集,建立了三种合金相分类器:一种分类器用于评估合金的玻璃形成能力;另一种分类器用于区分固溶体(SS)、固
数据不平衡是数据驱动方法在材料数据建模中面临的关键挑战。在本研究中,开发了主动学习模型来缓解高熵合金(HEAs)相选择过程中的数据不平衡问题。基于包含149个特征的三组数据集,建立了三种合金相分类器:一种分类器用于评估合金的玻璃形成能力;另一种分类器用于区分固溶体(SS)、固溶体+间隙相(SS+IM)和间隙相(IM);第三种分类器用于区分体心立方(BCC)、面心立方(FCC)、体心立方+面心立方(BCC+FCC)和六方密排(HCP)相。通过多阶段特征选择、主动学习、成本敏感策略、聚类分析和集成学习的综合应用,有效减轻了样本分布偏差。模型性能通过实验合成和独立的外部数据集得到了进一步验证,显示出强大的预测能力。SHAP分析和符号分类发现了一个新的相选择参数,能够精确区分BCC相和FCC相。此外,还构建了一个基于委员会的主动学习框架,以在数据稀疏的情况下提高分类准确性,从而推动了合金开发的数据驱动策略。该框架为处理稀疏和不平衡的材料数据时改进机器学习建模提供了一种通用且高效的解决方案。