揭示有机光伏中的结构-性能关系:用于预测功率转换效率的可解释机器学习模型

《IEEE Journal of Photovoltaics》:Uncovering Structure–Performance Relationships in Organic Photovoltaics: Interpretable Machine Learning Model for Predicting the Power Conversion Efficiency

【字体: 时间:2025年11月19日 来源:IEEE Journal of Photovoltaics 2.6

编辑推荐:

  有机光伏材料设计通过XGBoost模型结合密度泛函理论计算实现高效预测,R2达0.918,并利用SHapley分析识别关键分子结构。

  

摘要:

有机光伏(OPVs)是一种具有前景的光伏技术,但传统上候选分子的设计方法依赖于试错法,这种方法效率低下。然而,机器学习通过从大规模OPV材料数据集中学习,提供了一种基于数据的策略,有助于加速高性能OPV材料的发现和优化。在本研究中,我们使用极端梯度提升(XGBoost)模型,利用从哈佛光伏数据集(HOPV15)中提取的结构特征来预测OPV供体材料的密度泛函理论计算出的功率转换效率(PCE)。为了提高预测性能,我们根据随机森林和XGBoost的平均特征重要性得分,选择了最具信息量的分子特征。我们的XGBoost模型在HOPV15数据集上实现了最先进的预测准确性,其R2值为0.918,RMSE为0.302%,优于以往的方法。通过使用Shapley加性解释(SHapley Additive Explanations),我们识别出了影响PCE的关键Morgan和PubChem子结构,提供了可解释的见解。该框架支持准确且可解释的OPV预测,并为高通量筛选带来了希望。

引言

随着全球能源需求的快速增长,由于低成本生产和结构灵活性,有机光伏(OPVs)已成为传统硅基太阳能电池的有希望的替代品[1]。OPVs使用共轭有机分子作为活性层材料,其功率转换效率(PCE)主要由供体的最高占据分子轨道(HOMO)与受体的最低未占据分子轨道(LUMO)之间的能量差决定[2][3]。PCE可以通过实验装置进行测量,这些装置评估开路电势、短路电流密度和填充因子等参数,但由于制造条件和测量协议的不同,这些方法存在不一致性[4][5]。计算方法,如密度泛函理论(DFT)和Scharber模型(见补充材料第B节,方程S1),可以提供PCE的理论估计,但计算成本较高,且对于复杂的OPV系统来说准确性有限[6][7]。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号