通过增强数据和物理化学描述符,利用机器学习技术预测氧化物玻璃的介电常数
《Materials Genome Engineering Advances》:Machine learning-enabled prediction of oxide glasses’ dielectric constants via augmented data and physicochemical descriptors
【字体:
大
中
小
】
时间:2025年10月22日
来源:Materials Genome Engineering Advances
编辑推荐:
机器学习结合数据增强和物化描述符方法,构建了氧化物玻璃介电常数的高效预测模型。通过集成学习生成伪标签,将数据集从1503扩展至11,029,XGBoost模型R2达0.96,较未增强模型误差降低48%。SHAP分析表明,结构描述符(如配位数、键强度)占总重要性的69.9%,证实网络工程是优化介电性能的核心策略。研究验证了C-M方程在计算总极化率中的有效性,并拓展至含Y?O?和La?O?的新型玻璃体系,平均偏差2.46%-4.76%。
在现代通信技术快速发展的背景下,尤其是5G和6G系统的推进,对高频设备的性能提出了更高的要求。其中,氧化物玻璃的介电常数(εr)调节成为关键挑战之一,因为εr直接影响信号传播效率。为了解决这一问题,研究人员提出了一种结合数据增强与物理化学描述符整合的机器学习框架,以应对实验数据不足的限制。该方法通过集成学习生成伪标签,将原始数据集从1503个玻璃组成扩展至11,029个,且避免了数据分布的偏移。最终,基于增强后的数据集训练的XGBoost模型表现出卓越的预测精度,其R2值达到0.96,均方误差(MSE)为0.14。对于未知数据的预测任务,该模型相较于非增强模型将误差率降低了48%,并比GlassNet模型提升了43%的泛化性能。此外,通过SHAP分析,研究人员识别出B?O?和SiO?为εr的抑制剂,而BaO和TiO?则为增强剂,这一发现与玻璃网络形成者和修饰剂的结构角色相一致。进一步利用克劳修斯-莫索蒂(C–M)回归方法,研究者获得了各阳离子的极化能力数据,其R2值为0.909。通过整合物理化学描述符(如配位数和键强度),该模型能够在Y?O?和La?O?体系中实现可迁移的预测,其平均偏差在2.46%到4.76%之间。更重要的是,结构描述符在极化能力中的贡献率高达69.9%,表明网络工程是调控介电常数的最佳设计范式。这种数据驱动的方法为理性设计介电玻璃提供了新的途径。
在5G/6G系统不断推进的背景下,对高频通信设备的需求日益增长,这促使了对高性能材料的迫切需求。氧化物玻璃因其优异的介电特性、良好的表面完整性以及广泛的可加工性,成为重要的候选材料。特别是玻璃纤维等结构形式,使得其在通信设备中具有广泛的应用潜力。然而,介电常数的精确调控仍然是一个关键挑战,尤其在满足新一代通信技术对特定介电性能的需求方面。传统的试错实验不仅耗时耗力,而且成本高昂,对环境也不友好。相比之下,基于计算的方法能够建立结构与性能之间的关系模型,从而实现材料的理性设计和系统的成分优化,大幅降低研发成本和实验验证周期。克劳修斯-莫索蒂关系式是目前预测介电常数的主要理论框架,它表明介电常数由材料的电子极化能力和摩尔体积共同决定。这一理论在陶瓷和玻璃系统中得到了广泛验证,显示出理论预测与实验测量之间的一致性。然而,对于氧化物玻璃而言,由于其非晶态的特性,局部电场效应的增强导致了有效离子极化能力的提升,使得直接应用已知的离子极化数据(如香农数据集)受到限制。
为了解决数据稀缺的问题,研究团队采用了一种创新的数据增强策略。他们通过集成学习为DENSET数据集生成伪标签,并将这些伪标签整合到原始数据集中,从而构建了一个更大的数据集。这种方法不仅提高了模型的泛化能力,还确保了数据的真实性和可靠性。通过这一策略,数据集的规模从1503个玻璃组成扩展至11,029个,同时避免了数据分布的偏移。基于增强后的数据集,XGBoost模型表现出显著的优势,其预测精度和泛化能力均优于其他模型,例如随机森林(RF)、K近邻(KNN)、人工神经网络(ANN)和决策树(DT)。此外,该模型在预测未知数据时,相较于非增强模型和GlassNet模型,误差率显著降低,验证了其在复杂玻璃体系中的适用性。
在数据增强过程中,研究人员特别关注伪标签的可靠性问题。由于DENSET数据集本身没有真实的标签,因此伪标签的质量直接影响模型的性能。为了解决这一问题,团队采用了多种模型进行集成学习,并通过方差分析筛选出稳定性较高的预测结果。最终,他们保留了预测方差低于0.1的模型,以确保伪标签的准确性。这一策略使得增强后的数据集在保持原有结构特征的同时,也扩大了数据规模,从而提高了模型的预测能力。实验结果表明,增强后的数据集在模型训练过程中表现出良好的性能,且其预测误差在可接受范围内。
为了进一步理解玻璃成分对介电常数的影响,研究团队采用SHAP分析方法,量化了各氧化物对介电性能的贡献。SHAP是一种基于博弈论的特征归因方法,能够解释模型预测中的关键因素。通过分析XGBoost模型的预测结果,研究人员发现B?O?、SiO?和P?O?作为主要的网络形成者,其浓度的增加会显著降低玻璃的介电常数。这种现象源于这些成分能够减少非桥氧(NBO)的比例,并抑制自由离子在玻璃网络中的迁移,从而抑制极化机制。相反,作为网络修饰剂的Na?O、Li?O和CaO则通过引入可迁移的阳离子(如Li?、Na?和Ca2?)来增强介电常数。此外,高极化能力的阳离子如BaO、TiO?、PbO和ZnO则通过电子极化机制进一步提升介电响应。Al?O?和MgO则表现出成分依赖性的影响,其作用机制与Al3?的配位灵活性密切相关:在碱金属丰富的体系中,Al3?倾向于形成[AlO?]四面体结构,而在碱金属含量较低的体系中,则倾向于形成[AlO?]和[AlO?]多面体结构。这些不同的结构特性决定了它们在玻璃中的不同作用。
为了进一步验证模型的泛化能力,研究团队对包含Y?O?和La?O?的未知玻璃组成进行了测试。结果表明,XGBoost模型在这些成分上的预测误差分别为2.46%和4.76%,显示出其在成分多样化玻璃体系中的强大适应能力。此外,SHAP分析揭示了结构描述符在调控极化能力中的主导作用,其特征重要性达到69.9%。这一发现表明,通过结构工程优化玻璃网络结构,是实现介电常数调控的最有效策略。这种基于物理化学描述符的机器学习方法不仅提高了模型的预测精度,还为玻璃材料的设计提供了新的思路。
为了建立更全面的预测框架,研究团队进一步扩展了模型的应用范围,使其能够预测玻璃的总极化能力。他们利用克劳修斯-莫索蒂关系式,将玻璃的成分与极化能力之间的关系建模为多变量线性回归模型。该模型基于增强后的数据集进行训练,并通过SHAP分析解释了各特征对总极化能力的影响。实验结果表明,该模型在预测总极化能力方面表现出良好的一致性,其R2值为0.909,说明模型能够有效捕捉玻璃成分与极化能力之间的关系。此外,通过整合物理化学描述符(如配位数、键强度等),研究团队开发了一个可迁移的模型,该模型在未知的Y?O?和La?O?体系中表现出优异的预测能力。
为了提高模型的解释性,研究团队还采用了一种结构化特征工程的方法。他们将物理化学描述符分为三类:结构参数、能量特性以及基本的离子特性。通过对这些描述符的归因分析,研究人员发现结构参数在极化能力调控中占据主导地位,其贡献率高达69.9%。这表明,通过调控玻璃的微观结构,如优化离子的配位环境和键合特性,可以更有效地控制其介电性能。这一发现为玻璃材料的理性设计提供了重要的理论依据,也为未来在更广泛的玻璃体系中实现介电性能的精准调控奠定了基础。
此外,研究团队还验证了模型在不同数据规模下的表现。随着数据增强的进行,模型的预测能力显著提升,其R2值从0.92增加到0.96,同时预测误差也大幅减少。这一结果表明,数据增强不仅扩展了数据集的规模,还提升了模型的预测精度和泛化能力。研究团队进一步发现,伪标签的引入虽然可能带来一定的偏差,但只要大部分伪标签是正确的,模型的训练效果仍然可以得到显著改善。这表明,数据增强策略在提升玻璃介电性能预测能力方面具有显著优势。
研究团队还对模型的特征重要性进行了深入分析,以揭示玻璃成分对介电常数和总极化能力的影响机制。通过SHAP分析,他们发现不同氧化物对玻璃性能的贡献具有显著差异。例如,B?O?、SiO?和P?O?作为主要的网络形成者,其高浓度会显著降低介电常数,而BaO和TiO?则作为增强剂,能够提升介电响应。同时,Al?O?和MgO的贡献则表现出成分依赖性,其作用机制与Al3?和Mg2?的配位特性密切相关。这种特征重要性的分析不仅帮助研究人员理解不同成分在玻璃体系中的作用,还为未来的玻璃材料设计提供了指导。通过识别关键成分及其作用机制,研究团队能够更高效地优化玻璃的介电性能,以满足下一代通信技术的需求。
为了确保模型的可迁移性,研究团队还考虑了玻璃成分的多样性。他们通过引入物理化学描述符,如原子体积、键强度、配位数等,构建了一个更加全面的特征空间。这些描述符不仅能够解释已知成分的极化行为,还能用于预测未知成分的性能。通过这种方式,模型能够在不同的玻璃体系中保持良好的预测能力,从而为材料设计提供更广泛的适用性。此外,研究团队还对模型的训练过程进行了详细优化,通过贝叶斯优化调整模型的超参数,以提高其预测精度和泛化能力。
总的来说,这项研究通过结合数据增强和机器学习方法,成功构建了一个能够精准预测氧化物玻璃介电常数和总极化能力的模型。该模型不仅在已知数据集上表现出优异的性能,还能有效预测未知成分的玻璃性能,从而为下一代通信技术中的高频设备开发提供了重要的理论支持和技术手段。通过SHAP分析,研究人员揭示了玻璃成分与介电性能之间的复杂关系,并指出了结构工程在优化介电常数中的关键作用。这些发现为未来玻璃材料的理性设计和性能调控提供了新的思路和方法,有助于推动高性能氧化物玻璃在5G/6G通信系统中的应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号