"SuperBand:超导体电子能带与费米面结构数据库的构建及其在机器学习预测中的应用"

【字体: 时间:2025年05月07日 来源:Scientific Data 5.8

编辑推荐:

  研究人员针对超导体电子能带数据匮乏的问题,构建了首个涵盖1,362种超导体和1,112种非超导体的电子能带结构数据库SuperBand。通过密度泛函理论(DFT)计算获取能带结构、态密度(DOS)和费米面数据,结合高吞吐量计算协议和3DSC方法处理掺杂结构,为机器学习预测超导临界温度(Tc)提供了标准化数据集。该研究解决了传统超导体研究中电子结构数据缺失的瓶颈,推动了大样本超导机制解析和新材料发现。

  

超导材料因其零电阻特性和量子效应,在能源传输、医疗成像等领域具有革命性潜力。然而,超导临界温度(Tc)的提升长期受限于机制认知不足,尤其缺乏系统化的电子结构数据支撑。传统研究依赖化学式、晶格结构等简单特征,难以揭示超导现象的深层物理机制。更关键的是,现有数据库如SuperCon虽收录3万余种材料,但电子能带、费米面等关键参数严重缺失,制约了机器学习在超导材料预测中的应用。

针对这一瓶颈,燕山大学与中山大学联合团队在《Scientific Data》发表了SuperBand数据库。研究团队创新性地整合密度泛函理论(DFT)、高吞吐量计算和结构优化算法,构建了目前最全面的超导体电子结构数据库。该工作不仅包含1,362种超导体的能带结构、态密度(DOS)和费米面数据,还收录1,112种非超导体作为负样本,为机器学习模型训练提供了高质量基准数据集。通过3D-Vision Transformer模型验证,该数据集对Tc的预测精度达到R2=0.976,显著推动了数据驱动的超导材料发现。

关键技术方法包括:1) 从SuperCon和Materials Project(MP)获取原始数据,采用3DSC方法处理掺杂结构;2) 基于VASP软件进行DFT计算,设置520 eV截断能和PBE泛函,采用GGA+U处理强关联体系;3) 使用IFermi工具标准化k空间网格至32×32×32,聚焦费米面附近18条能带;4) 通过Atomate和FireWorks实现高通量计算流程自动化。

研究结果
数据清洗与结构优化
通过Ewald能量筛选获得1,763种有序晶体结构文件(CIF),解决MP数据库中34%材料的无序占位问题。对掺杂超导体采用超胞扩展策略(如2×2×2超胞处理掺杂浓度>0.1的体系),以YBa2Cu3O7为代表,统一标注其衍生材料的最高Tc=95 K。

电子结构特征规律
DFT计算揭示超导体显著倾向高对称性结构:四方相(453种)和立方相(439种)占比最高。但Tc>40 K的材料中,正交相比例激增,暗示低对称性可能促进非常规超导(如铜酸盐和铁基超导体)。

机器学习验证
采用18×8×8×8张量输入和3层Transformer架构,模型在log(Tc+1)尺度下实现MSE=0.127。特别地,铁基超导体KFe2Se2(mp-1070735)的能带计算与MP数据库误差<0.01 eV,证实数据可靠性。

结论与意义
该研究首次系统建立了超导体电子结构参数与Tc的关联框架,突破传统仅依赖化学组成的局限。通过标准化能带数据格式(18×32×32×32张量)和开源工具链(GitHub/SuperBand),为领域内提供了可扩展的分析平台。值得注意的是,数据库特别标注了159种无文献记载的超导体和1,780种非超导材料,这对理解超导相边界具有独特价值。未来工作可结合HSE06或GW方法提升强关联体系计算精度,并扩展高压氢化物等特殊体系。这项成果为加速"超导基因组"研究和工业应用奠定了数据基石。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号