反铁磁材料生成预测框架:集成CDVAE-DA、CGCNN与遗传算法的高效设计与发现
【字体:
大
中
小
】
时间:2025年09月27日
来源:Advanced Science 14.1
编辑推荐:
本综述系统介绍了一种集成晶体扩散变分自编码器与数据增强(CDVAE-DA)、晶体图卷积神经网络(CGCNN)、遗传算法(GA)和密度泛函理论(DFT)验证的反铁磁材料(AFM)生成预测框架。该框架通过迁移学习实现90.68%的成分有效性,成功预测出MnS、FeO4P等新型AFM半导体与金属材料,为超快自旋电子学材料发现提供了创新范式。
反铁磁材料(AFM)因其原子磁矩反平行排列产生零净磁化强度,在下一代超快自旋电子学中展现出巨大潜力。这种独特的磁结构赋予其显著优势:抗外磁场干扰性强、无杂散场且具有本征太赫兹自旋动力学。然而,AFM材料的发现仍面临重大挑战。传统高通量密度泛函理论(DFT)在处理关联电子系统和复杂磁有序方面存在局限,特别是对于金属磁体,宽窄能带共存往往导致集体电子行为,阻碍准确描述。超越DFT的混合泛函方法对金属体系效率低下,即使机器学习增强的工作流在迭代结构弛豫过程中也遇到困难。
材料性能本质上由其晶体结构决定,传统方法主要基于已知结构预测性能。相反,逆向材料设计涉及根据预定义目标性能范围预测和设计微观结构。深度生成模型的最新进展通过数据驱动的分布学习为晶体结构预测提供了新机遇。晶体扩散变分自编码器(CDVAE)能够生成具有化学有效成分、适中键长和热力学稳定性的多样化晶体结构。然而,生成模型面临几个持续挑战:直接在稀疏材料数据集上训练的网络通常泛化能力受损;当前框架尚未解决AFM有序约束的融入;这些模型固有地倾向于产生类似训练数据的输出,从根本上限制了对已建立化学空间之外的探索。
本研究开发的AFM发现框架整合了四个领域:通过CDVAE-DA进行结构生成,使用CGCNN进行基于性能的预筛选,通过GA优化潜在向量(Z),以及通过DFT验证进行结构弛豫和AFM稳定性评估。该方法使我们能够在广阔未探索的组成空间中生成和识别新的AFM。
首先利用CDVAE-DA产生高质量合理的 novel 晶体结构。输入晶体结构表示为M(A, X, L),其中A代表原子类型,L是定义周期对称性的周期晶格向量,X表示晶胞内原子坐标。通过应用仿射旋转实现数据增强,在每个训练批次中将输入晶体结构的晶格向量和坐标重新定向到特定方向。同时采用迁移学习,在有限的AFM特定数据集上对MP-20预训练的CDVAE-DA进行微调,以实现从潜在空间向量 targeted 生成 novel 结构。
其次,三个结构相同但权重独立的CGCNN分别预测 formation energy(FE)、total magnetic moment(TMM)和 band gap(BG),用于预筛选潜在AFM。第三,GA通过交叉生成晶体的表示来更新潜在向量,保留编码AFM特征的表示。最后,DFT用于晶体弛豫和生成晶体的性能计算以确认新的AFM。
开发了三个结构相同的CGCNN分别预测FE、TMM和BG。图表示通过结合one-hot编码元素特性(原子质量、极化率、共价半径)的特征向量对原子节点进行编码。边缘属性使用6?截止半径内相邻原子间指数衰减距离过滤器捕获原子间相互作用。
从Materials Project数据库提取19174种磁性材料及其相应性能。对于FE训练,使用整个数据集。对于TMM训练,专注于0-10μB f.u.?1范围内的数据(共计13418个结构),以减少10μB f.u.?1以上有限数据的影响。对于BG训练,战略性地将主导的零带隙子集(10708种材料)下采样80%,生成10607种材料的平衡子集,具有受控的相表示。
为更直观反映预测误差,采用平均绝对误差评估CDVAE-DA。使用AFM数据集对CDVAE-DA进行的初始训练揭示了网络收敛的基本挑战。晶格向量长度和轴间角的振荡损失无法收敛,表明网络未能有效学习AFM材料的结构分布。这种限制源于AFM数据集的两个内在特征:与MP-20数据集相比样本量有限,以及更广泛的元素多样性使特征提取复杂化。
为解决这些挑战,实施了两阶段迁移学习策略。首先在MP-20数据集上训练CDVAE-DA,建立晶体化学基础知识,包括晶格对称性模式和原子配位偏好。还将CDVAE-DA的重建和生成能力与FTCP、CDVAE和DiffCSP进行基准测试。在这些方法中,CDVAE-DA达到90.68%的最高组成有效性,在生成化学合理晶体结构方面表现出相对优势。
随后,在AFM数据集上对预训练的CDVAE-DA进行微调,实现磁性结构关联的靶向学习,同时保留一般晶体学原理。这种分层方法实现了稳定收敛,预测误差单调递减。500个epoch后,轴间角偏差减少约50%,晶格常数误差减少约60%,证实了框架捕获AFM系统几何和磁性特征的能力增强。
CGCNN训练期间采用均方误差作为损失函数。对于FE预测,CGCNN实现0.0029和0.0147的低训练和验证损失,表明CGCNN有效捕获晶体结构与FE之间的关系。训练和测试集的散点图显示数据点紧密沿对角线对齐,进一步证明CGCNN的高预测精度。
对于TMM预测,CGCNN达到0.3568和0.576的训练和验证损失。训练和测试数据集也显示沿对角线的紧密对齐,突出CGCNN在识别不同晶体结构TMM方面的有效性。
在BG预测方面,CGCNN的训练和验证损失分别为0.024和0.037,表明其将晶体结构映射到BG的能力。预测的BG主要聚集在0-3eV范围内,对角线附近浓度密集。测试集数据也主要落在0-3eV范围内并与对角线紧密对齐,表明良好的泛化能力。然而,对于BG超过5eV的晶体结构,预测值与实际值存在轻微偏差。这种差异可能源于训练数据中此类大BG结构数量有限,限制了CGCNN学习其特定特征的能力。
在框架中,三个CGCNN预测生成结构的FE、TMM和BG。这些性能用于确定GA中的适应度得分。由于稳定AFM通常表现出负FE和较低TMM,并考虑CGCNN网络测试集误差,将GA的适应度标准设置为FE<0eV atom?1和TMM在0-0.7μB f.u.?1范围内。此外,考虑到AFM金属和半导体在自旋电子应用中的巨大潜力,采用0-1eV的BG标准以覆盖两种材料类型。
为实现AFM有序,需要自旋子晶格中偶数个磁性原子,在每个GA生成中优先选择具有偶数磁性原子数的结构,并相应分配更高的适应度得分。随后基于适应度得分进行概率选择,初始化下一代结构生成的潜在向量。每个步骤生成100个结构,共20个步骤。
AFM候选在第10步后产生四个结构的峰值,并在15步后接近稳定。这种趋势可能源于潜在向量在候选结构中的随机选择和交换交叉点,这些交叉点在连续迭代中保留编码AFM特征的表示,稳步增加产生AFM结构的可能性。
在第10和第11步之间,AFM候选数量急剧下降,而满足BG标准的结构数量上升。由于最后一步100个最终生成结构中只有一小部分满足BG标准,GA优先考虑编码低BG值的潜在向量,以满足BG标准而牺牲AFM特征保留。这种权衡减少了候选数量,同时提高了整体适应度。在第15和16步之间发生类似转变,当算法偏好BG和TMM目标时,导致FE<0eV atom?1的结构暂时下降。尽管如此,73.8%的所有生成结构保持FE<0eV atom?1,表现出良好的稳定性,并筛选出23种潜在AFM材料。
进行DFT计算以确定23种候选材料在铁磁(FM)和AFM自旋配置下的FE。结果显示MnS、OV2、FeO4P和MnO在AFM配置中表现出比FM状态更低的FE。使用Pymatgen的相图分析仪计算生成材料的凸包上方能量。计算显示MnS、FePO4和MnO的凸包上方能量为0eV atom?1,表明它们的热力学稳定性。
为深入了解这些材料的磁晶各向异性,结合自旋轨道耦合(SOC)效应,计算MnS、FePO4和MnO沿各种晶轴自旋排列的FE。对于MnS,自旋磁矩主要位于Mn原子上。SOC计算显示当自旋平行于c轴排列时获得最低FE,确定其为MnS中磁晶各向异性的易轴。AFM基态的FE计算为-27.1845eV,低于FM状态(-27.1611eV)。能带结构表现出简并自旋向上和向下通道,这是AFM有序的标志,以及费米能级附近1.0076eV的BG,表明半导体行为。
类似地,FeO4P和MnO也采用AFM基态。在FeO4P和MnO中,磁矩分别主要来自Fe和Mn原子,a轴被确定为两种结构中磁晶各向异性的易轴。能带结构分析确认自旋简并无检测到自旋分裂,与AFM有序一致。这些系统还表现出半导体电子结构,计算出的BG分别为FeO4P 1.1320eV和MnO 1.5364eV。此外,生成的MnS结晶为四方晶系,而FeO4P和MnO均采用单斜结构。这些晶系不同于先前报道的配置和Materials Project数据库中记录的配置。
此外,DFT计算识别AuMn2Pd、FNi、CMn和IrSc为具有FM基态的系统。
进一步评估无GA优化的框架生成性能。训练的CDVAE-DA生成5000个晶体结构,涵盖84种元素,其中3d过渡金属(Fe、Mn、Cr等)表现出48.8%的高普遍性。磁性元素的这种优先掺入源于网络在AFM数据集上的训练,可能导致产生具有磁性相互作用的结构。
随后使用CGCNN预测这些材料的FE、TMM和BG。样本数量相对于TMM和BG值的分布如图所示。专注于FE<0eV atom?1、TMM在0-0.7μB f.u.?1之间和BG在0-1eV之间的结构。这种筛选产生49个可行结构。其中,识别出7种材料满足两个额外约束:每个晶胞偶数个磁性原子(实现AFM有序)和总晶胞原子数<20(有利于结构简单性)。
凸包上方能量和磁性性能分析识别出两种具有负FE的稳定金属AFM:LiVO2和LiFeN。在这些化合物中,磁矩分别主要位于V和Fe原子上。磁晶各向异性的SOC计算表明,当磁矩沿LiVO2的b轴和LiFeN的c轴排列时达到最低能量状态。AFM状态相对于FM配置的能量降低分别为LiVO2 0.5244eV和LiFeN 1.4957eV。基态AFM结构显示沿易轴相邻磁矩反平行排列。电子能带结构显示无自旋分裂,证明自旋简并与AFM有序一致。此外,它们显示无带隙电子结构,自旋简并能带在费米能级交叉,确认金属和AFM特征。声子色散计算显示无虚频率,表明这些材料是动态稳定的。这些结果验证了发现化合物中强电子关联和长程AFM有序的共存。在验证过程中,排除了四种铁磁性和一种非磁性材料。
开发了用于AFM发现的生成框架。CDVAE-DA可实现90.68%的生成材料组成有效性率。在CGCNN预测和GA指导下,适应度标准定义为FE<0eV atom?1、BG在0-1eV范围内、TMM在0-0.7μB f.u.?1范围内,20个步骤共生成2000个结构,筛选出23种候选材料。通过DFT验证,确认了三种半导体AFM:MnS、FeO4P和MnO。这些材料表现出稳定的AFM配置,其自旋简并能带结构与AFM有序一致。
此外,直接使用CDVAE-DA和CGCNN无GA进行AFM设计。在5000个生成结构中,识别出两种稳定金属AFM:LiVO2和LiFeN。结果表明GA可有效调节潜在向量分布以加速AFM生成。工作验证了所提出材料设计框架在生成用于下一代自旋电子学的AFM方面的有效性,并提供了适用于更广泛材料系统的通用模板。未来工作可结合时间反演对称性和空间反演对称性约束,以生成更广泛稳定、独特和 novel 的AFM材料。
CDVAE-DA是原始CDAVE的扩展,采用SE(3)-等变周期图神经网络(PGNN)在编码和解码过程中 individually 保留晶体对称性和边界相互作用。编码器利用DimeNet++将晶体结构M(A, X, L)映射到潜在向量Z,而解码器结合多层感知器(MLP)与GemNet-dQ用于晶体结构重建M′(A′, X′, L′)。在生成过程中,基于从正态分布采样的Z,使用MLP网络预测原子数N、晶格向量L和组成c。然后使用N、L、c和Z随机初始化结构。利用解码器执行退火朗之万动力学去噪坐标X和原子类型A,最终生成新的晶体结构。
通常,旋转操作有效扩展训练集,实现整个数据集的数据增强。通过应用旋转矩阵到输入结构M(A, X, L)实现,产生变换晶体:具有相应重建输出。包括六个旋转矩阵,用于旋转坐标X和晶格向量L。并非每个样本应用所有旋转(6×数据集扩展),而是在每个epoch每个小批量随机选择一个。这平衡了增强 benefits 与计算效率。与 established 原则一致,使用变换输入训练诱导保留等变性的输出变换。因此CDVAE损失用等方差项增强。所有其他损失系数遵循CDVAE默认设置。本研究中的所有网络在配备RTX 4090和A6000 GPU的服务器上训练。
使用迁移学习策略通过利用MP-20数据集与AFM数据集之间的相关性来增强CDVAE-DA网络生成AFM的性能。主要采用预训练和微调方法。MP-20和AFM数据集分别用作源和目标域。
在CGCNN中,执行不同原子对应的原子质量、极化率和共价半径的one-hot编码以构建节点(3×64),相邻原子间的原子间距离用作边缘。随后设置全连接网络将原子特征集成到张量(1×64)中。然后使用两个连续图卷积层聚合和传递消息,捕获局部邻域信息并逐步构建全局特征。最后,基于输出通道为1的全连接层,聚合所有节点和边缘以预测性能,如FE、TMM和BG。利用均方误差评估CGCNN输出与标签之间的误差,其中是预测值,y是真实值,n表示样本总数。
GA是一种受自然选择和遗传原理启发的优化技术。GA使用选择、交叉和变异进化潜在解决方案群体,旨在找到最优或接近最优的解决方案。在本研究中,GA用于优化潜在向量,从而促进CDVAE-DA生成具有指定性能的晶体结构。
在第一性原理计算中,利用Amsterdam Modeling Suite Quantum Espresso 7.1(AMS-QE)包执行生成晶体的结构和几何优化,并采用AMS-BAND(BAND 2025.102)计算电子性能。在AMS-QE计算中,采用Monkhorst-Pack k点网格对布里渊区采样。每个晶格方向的k点数量选择使其与相应晶格常数(以埃为单位)的乘积≈60,确保足够的采样精度。此k点网格在结构弛豫和单点能量计算中使用。应用500eV的平面波截止能量以确保电子结构计算的收敛。在结构优化过程中,约束晶格防止变形。能量收敛标准设置为1×10?5 Hartree。
对于使用AMS-BAND的计算,采用Perdew-Burke-Ernzerhof(PBE)泛函处理电子交换的广义梯度近似(GGA),以及Slater型轨道的双zeta极化(DZP)基组。选择"unrestricted"选项捕获电子的自旋极化,冻结核心水平设置为"medium"。包括自旋轨道耦合(SOC)通过计算沿各种晶轴自旋排列的 formation energies 来评估磁晶各向异性。为解决过渡金属原子中的强电子关联,对其d轨道采用GGA+U方法,并入特定Hubbard U值:Mn为4.0eV,Fe为3.9eV,Co为3.7eV,Ni为6.2eV,V为3.25eV。此外,使用AMS-QE包计算生成晶体的声子色散关系。在声子计算中,k点网格和插值分别设置为9×9×9和100。选择"Numerical"执行解析声子计算,并基于其相应原胞在3×3×3超晶胞中计算晶体。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号