
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习驱动的二维材料激子效应研究:高通量预测与贝叶斯优化筛选
【字体: 大 中 小 】 时间:2025年09月25日 来源:Next Research
编辑推荐:
本研究针对传统GW/BSE方法计算激子结合能(EBE)耗时耗力的问题,开发了基于随机森林(RF)的机器学习框架,利用C2DB数据库材料描述符高效预测二维材料EBE,实现了R2=0.84的预测精度,并结合贝叶斯优化筛选出EBE高达2.67 eV的候选材料,为光电材料设计提供了新范式。
二维材料因其非凡的光电特性成为新一代光电器件的理想候选材料,其中激子效应尤为突出——由于介电屏蔽减弱和库仑相互作用增强,二维材料中的激子结合能(Exciton Binding Energy, EBE)远高于体材料。准确预测EBE对于设计高效光电器件至关重要,但传统的第一性原理计算方法如GW近似和Bethe-Salpeter方程(BSE)虽精度高却计算昂贵,严重制约了大规模材料筛选。因此,开发高效准确的EBE预测方法成为二维材料研究领域的迫切需求。
在此背景下,Ahsan Javed与Sajid Ali在《Next Research》发表了机器学习驱动的研究工作,通过建立计算高效的数据驱动模型来预测二维材料的激子结合能,加速具有显著激子效应材料的发现过程。研究人员利用 Computational 2D Materials Database (C2DB) 数据库,选取层厚度、层群数、原子序数、价电子数、自旋、原子数和PBE能带隙等特征,采用随机森林(RF)、梯度提升(GB)、支持向量回归(SVR)、核岭回归(KRR)和神经网络(NN)等多种机器学习算法进行训练与预测,并通过贝叶斯优化(Bayesian Optimization)结合高斯过程回归(Gaussian Process Regression)高效筛选具有高EBE的材料。
研究主要技术方法包括:从C2DB数据库获取二维材料数据集;基于皮尔逊相关系数和包装法进行特征选择;采用scikit-learn平台实现多种机器学习算法建模;使用贝叶斯优化框架以期望提升(Expected Improvement)作为采集函数进行材料筛选。
研究结果显示:
3.1. 准粒子能量预测
随机森林回归模型在预测G0W0能带隙(对应准粒子能量)方面表现出色,R2达到0.98,MAE和RMSE分别为0.20 eV和0.33 eV。误差分布直方图显示峰值接近零,表明预测值与C2DB数据库实际值高度吻合。
3.2. 激子结合能预测
随机森林模型在EBE预测中表现最佳,训练集MAE为0.070 eV,RMSE为0.126 eV;测试集MAE为0.081 eV,RMSE为0.148 eV,R2为0.84。梯度提升模型紧随其后(R2=0.80),而神经网络、KRR和SVR算法性能相对较差(R2≈0.56)。通过线性回归推导出EBE方程:EBE = 0.31EPBE - 0.15Z - 0.06d + 0.11nve + 0.94,表明PBE能带隙是EBE预测的最主要贡献因素。
3.3. 贝叶斯优化
通过贝叶斯优化框架筛选出EBE最高的二维材料,其中Li3Cl3(空间群p4/mmm)的预测EBE达2.67 eV。碱性土金属氯化物单层(如SrCl2, CaCl2, BaCl2)表现出高EBE(2.60-2.63 eV),这归因于氯原子的高电子亲和力增强了电子-空穴对的库仑吸引。过渡金属二硫属化合物(TMDC)单层中,HfS2(1.15 eV)、ZrS2(1.14 eV)和HfSe2(1.14 eV)的EBE预测值最高。
研究结论表明,机器学习方法特别是随机森林算法,能够有效建立廉价材料描述符与复杂激子性质之间的关联,为二维材料激子效应研究提供了计算高效的替代方案。贝叶斯优化框架进一步增强了材料发现过程的效率,能够快速识别出具有高EBE的候选材料。尽管该研究针对二维系统开发,但该方法具有通用性,可扩展至三维材料,大大拓宽了在材料发现中的应用范围。这项研究不仅加速了具有显著激子效应材料的筛选过程,也为下一代光电子器件的材料设计提供了重要理论指导和技术支持。
生物通微信公众号
知名企业招聘