编辑推荐:
在材料科学中,纳米材料结构测定颇具挑战。研究人员开展 “Ab initio structure solutions from nanocrystalline powder diffraction data via diffusion models” 研究,利用基于扩散过程的生成式机器学习模型 PXRDnet,成功解析多种纳米晶体结构,为纳米材料结构研究开辟新路径。
在材料科学的广袤领域中,原子排列(即材料结构)的精确测定一直是科研人员探索的核心。过去的百年间,材料领域的重大突破都建立在对原子排列深入理解的基础之上,因为材料的诸多特性都与其底层结构紧密相连。在理想情况下,单晶结构解析能够获取最大量的结构信息,但在实际应用场景里,获取纯净的单晶体样本并非易事,尤其是对于纳米级别的原子团簇而言,这一难题更为突出,即所谓的 “纳米结构问题”。纳米材料的衍射图案由于有限尺寸效应,布拉格峰显著展宽,信息含量大幅降低,从重叠峰中提取峰强度变得极为困难,这使得从信息退化的衍射图案中解析结构成为材料科学领域亟待攻克的难关。
为了解决这一棘手问题,来自哥伦比亚大学(Columbia University)、斯坦福大学(Stanford University)等机构的研究人员展开了深入研究。他们利用基于扩散过程的生成式机器学习模型,经过大量已知结构数据的训练,开发出 PXRDnet 模型。研究发现,PXRDnet 模型仅依据化学式和信息匮乏的有限尺寸展宽粉末衍射图案,就能成功解析多种不同对称性和复杂度的纳米晶体结构,涵盖了所有七个晶系。这一研究成果意义重大,为纳米材料结构的解析提供了全新的方法和思路,在《Nature Materials》上发表,引起了材料科学领域的广泛关注。
研究人员在研究过程中运用了多种关键技术方法。首先,构建了 MP - 20 - PXRD 数据集,该数据集源于 Materials Project 数据库,包含 45,229 种材料,用于对 PXRDnet 模型进行端到端的训练。其次,采用有限尺寸效应模拟方法,通过卷积 sinc2函数和高斯平滑处理,模拟纳米颗粒的有限尺寸对衍射图案的影响。此外,以 CDVAE 为基础模型构建 PXRDnet,利用其变分自编码器(VAE)和去噪扩散网络的特性,并通过 PXRD 回归器和公式引导的反向传播等机制,实现结构解析 。
研究结果
- 纳米结构评估设置:为测试 PXRDnet 模型的有效性,研究人员模拟了 10? 和 100? 晶体尺寸的 PXRD 图案,并将其与材料化学式一同输入模型。同时,以 CDVAE - Search 模型作为基线模型进行对比。
- 定性分析:从 PXRDnet 模型精修后的输出结果来看,该模型能够成功解析多种无机化学成分材料的结构,在捕捉不同晶格形状和对称性方面表现出色。即使在部分解析失败的案例中,也能引导出合理的原子堆积和晶格形状。
- 定量分析:研究采用 Rwp2(轮廓加权 R 因子)作为评估指标,数值越低表明结构解析越成功。定量结果显示,PXRDnet 模型在重构 MP - 20 材料方面表现优异,明显优于 CDVAE - Search 基线模型。
- 不同晶系的比较:研究发现,立方晶系的结构最容易解析,随着结构对称性降低,解析难度增大,三斜晶系和四方晶系的解析效果相对较差。
- 结构精修步骤测试:对 PXRDnet 解析的部分结构进行 Rietveld 精修,结果表明,对于 100? 的测试案例,精修效果良好,能使多数 Rwp2值降至 10% 以下;但对于 10? 的纳米颗粒,由于衍射图案严重扭曲,精修效果欠佳。
- 真实材料实验 PXRD 图案的性能测试:利用从 IUCr 数据库获取的实验 PXRD 图案进行测试,发现 PXRDnet 模型在处理真实实验数据时,通过 Rietveld 精修,能较好地匹配实验测定的 PXRD 图案和已知的真实结构,但仍存在一些细微缺陷,如原子种类混淆或部分原子位置偏差。
研究结论与讨论
PXRDnet 模型中的扩散模型为从信息受损的输入数据(如纳米材料数据)中解析结构迈出了重要一步。该模型作为一种端到端的方法,使用便捷,虽无法保证 100% 的成功率,但能提供可供进一步评估的结构候选。研究还发现,PXRDnet 在低信息输入情况下表现出色,突破了以往方法的局限。然而,该模型也存在一定的局限性,如需要预先知晓化学式,且当前研究中材料的晶胞原子数最多为 20 个 。未来的研究可针对这些局限展开,探索在部分或完全未知化学成分的情况下解析结构的方法,拓展模型对更多原子晶胞材料的适用性,同时提高模型对背景信号的鲁棒性,进一步优化结构精修方法,从而推动计算晶体学和材料科学的发展。