理解晶体无序结构:在材料发现中架起预测与实验之间的桥梁

《Advanced Materials》:Learning Crystallographic Disorder: Bridging Prediction and Experiment in Materials Discovery

【字体: 时间:2025年10月26日 来源:Advanced Materials 26.8

编辑推荐:

  计算材料发现中需考虑晶体学无序性,本研究通过机器学习分类模型预测材料无序倾向。分析ICSD数据库发现,元素种类越多越易出现无序结构,且73%无序为取代型无序。构建基于嵌入和LSTM的模型,在测试集上达到90%准确率。应用于MP和GNoME数据库,发现MP中39-47%预测为无序,GNoME高达80-84%。证实无序在计算预测中普遍存在,需纳入材料设计流程。

  近年来,随着计算材料学的迅速发展,大规模数据库和新型机器学习(ML)工具的出现极大地推动了材料发现领域的进步。这些工具不仅提高了材料预测的效率,还使得研究人员能够在更广泛的化学空间中探索潜在的新材料。然而,当前的计算材料发现方法大多集中在预测纯净的晶体结构上,忽略了现实材料中普遍存在的晶格无序现象。这种无序性在实验合成、表征或材料应用过程中常常出现,尤其在从绝对零度(0 K)向实际条件过渡时更为显著。由于计算资源的限制和实验验证的困难,许多预测的材料无法在实验中实现,因此,引入对无序性的考虑成为材料发现流程中的一个关键挑战。

在材料科学中,无序性通常指材料中元素在晶格中的非均匀分布,可以表现为两种主要形式:替代无序和位置无序。替代无序是指不同元素在同一个晶格位置上以一定的概率混合,而位置无序则指某个元素在多个晶格位置上以部分占有率存在。这些无序现象在实际材料中可能对性能产生深远影响,例如提高电荷传输能力、增强机械性能或优化热稳定性。然而,传统的计算方法,如基于密度泛函理论(DFT)的相对能量计算,通常只关注于0 K下的有序结构,这导致了对材料无序性的低估。

为了解决这一问题,本研究引入了一种基于机器学习的分类模型,用于识别可能表现出无序性的材料。通过分析无机晶体结构数据库(ICSD),我们发现无序性在材料中广泛存在,尤其在具有更多元素的材料中更为常见。这一发现促使我们开发出能够从材料的化学组成中预测无序性的分类模型,从而在计算材料发现流程中引入对无序性的考量。这种模型的引入,有助于将计算预测与实验验证之间的差距缩小,为材料设计提供更加全面的信息。

为了构建这一分类模型,我们首先对ICSD进行了筛选和整理。ICSD包含了约220,000个实验确定的无机晶体结构,其中约47%的材料表现出无序性。我们排除了具有位置无序的材料,因为这类无序通常与非整比化学计量比或分子单位的旋转有关,而这些材料在计算材料发现中并非主要目标。最终,我们构建了一个包含118,684个晶体结构的训练数据集,其中79,788种独特的化学组成。根据这一数据集,我们训练了两种不同的机器学习模型:一种是基于均值池化的神经网络模型,另一种是使用长短期记忆网络(LSTM)进行池化的递归神经网络模型。这两种模型的测试集准确率分别达到了84%和90%,表明它们在识别无序性方面具有较高的可靠性。

在模型构建过程中,我们发现仅依靠元素对之间的无序概率(即从ICSD中统计得出的元素共存概率)作为分类依据的基线模型,其准确率仅为75%,且存在一定的预测偏差。相比之下,基于元素嵌入向量的模型能够更全面地捕捉材料的化学特性,从而提高分类的准确性。进一步地,我们发现,材料的无序性与其元素的化学相似性密切相关,尤其是那些在修改后的Pettifor尺度上接近的元素组合。此外,阳离子和阴离子之间几乎不存在共存的可能性,这与晶格中局部电荷平衡的物理规律相吻合。碳和氮等小半径元素则很少出现在替代无序中,这可能是由于它们的离子半径难以与其他元素匹配。

在对计算材料数据库(如Materials Project和GNoME)进行无序性预测时,我们发现这些数据库中无序材料的比例显著高于ICSD。在Materials Project中,预测的无序材料比例为39%至47%,而在GNoME中,这一比例甚至高达80%至84%。这种差异可以归因于两个因素:一是GNoME数据库中包含了更多复杂的多元素材料,这些材料更容易表现出无序性;二是GNoME的预测方法有意排除了其他计算数据库中已有的材料,从而引入了更多的无序性样本。这些预测结果表明,当前的计算材料发现方法在无序性识别方面存在一定的盲点,特别是在涉及复杂化学计量比的材料时。

为了验证这些模型的预测效果,我们参考了已知的实验数据。例如,Materials Project中预测的35种合成材料中有23种已被证实具有已知的无序相,而基于平衡分类阈值(50%)的RNN模型预测其中16种(70%)为无序材料。此外,GNoME数据库中的10种随机选取的材料也被分析,发现其中9种(90%)可能具有无序结构。这些结果表明,机器学习模型在识别无序材料方面具有一定的潜力,但也提醒我们,这些预测仍需进一步实验或计算验证。

本研究的成果不仅为材料发现提供了新的视角,也为未来的材料设计流程带来了重要的启示。通过引入对无序性的识别,计算材料学可以更准确地预测材料的热力学稳定性,并在设计阶段提前考虑无序性对材料性能的影响。例如,在锂离子电池的正极材料设计中,具有替代无序的材料(如Li1.211Mo0.467Cr0.3O2)已被证明能够提高电池的容量和稳定性。因此,将无序性纳入计算材料发现的流程,有助于更全面地理解材料的潜在性能,并指导实验合成的优先方向。

尽管当前的分类模型在识别无序性方面表现出较高的准确率,但它们仍存在一定的局限性。首先,这些模型目前仅考虑替代无序,而忽略了位置无序的影响,因此可能导致对无序程度的低估。其次,模型的训练数据主要来自ICSD,而ICSD中对无序材料的覆盖范围有限,这使得模型在处理更复杂的材料系统时可能面临挑战。此外,由于模型的预测结果依赖于化学组成,而非具体的晶体结构信息,因此在某些情况下,模型可能无法准确区分无序材料与有序材料。

为了进一步提升模型的性能,未来的计算材料发现工作可以结合更先进的方法,如蒙特卡洛模拟和基于机器学习的原子间势能模型(MLIPs)。这些方法能够更精确地描述无序材料的热力学行为,并为计算预测提供更可靠的依据。同时,我们还可以考虑引入更多类型的无序特征,如局部结构无序或动态无序,以提高模型对无序性的全面识别能力。此外,结合实验数据和计算预测的闭环系统,也有助于优化模型的准确性,并减少预测偏差。

总之,本研究展示了如何通过机器学习方法将无序性纳入计算材料发现的流程,为材料设计提供了新的工具和思路。随着计算资源的不断增长和数据的持续积累,未来有望开发出更加精确和高效的无序性识别模型,从而推动材料科学在理论预测和实验验证之间的协同发展。这不仅有助于发现更多具有实际应用价值的无序材料,也为材料的性能优化和结构设计提供了新的方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号