机器学习-DFT计算辅助逆向工程构建高极性表面积三苯胺聚合物化学空间及其光伏性能研究

【字体: 时间:2025年06月06日 来源:Journal of Molecular Graphics and Modelling 2.7

编辑推荐:

  本研究针对光伏材料中总极性表面积(TPSA)对溶解性、加工性和器件性能的关键影响,通过机器学习辅助逆向工程构建了高TPSA三苯胺(TPA)聚合物的化学空间。采用xGBoost和随机森林算法对543个TPA发色团数据集进行建模,实现TPSA高精度预测(R2 =0.93-0.96),发现硝基数量(NOCount)为最关键特征。成功设计出TPSA高达182的1000种新型聚合物,其HOMO-LUMO反向分布特性及优异的光伏参数(LHIE 54-79%,Voc 1.63-1.68 V,FF 0.54-0.92,Jsc 21.99-32.43 mA/cm2 )展现出巨大应用潜力。

  

在全球能源转型背景下,太阳能光伏技术作为清洁能源解决方案的核心,正面临效率提升与成本控制的双重挑战。传统硅基太阳能电池虽占据主流市场,但其高能耗制造工艺和刚性结构限制了应用场景。有机光伏(OPV)材料凭借其溶液可加工性、柔性特征和丰富的分子设计可能性,成为突破现有技术瓶颈的重要方向。其中,三苯胺(TPA)基聚合物因其独特的电子给体特性和结构可调性,在染料敏化太阳能电池(DSSC)中展现出卓越的光电转换潜力。然而,这类材料的性能优化长期依赖试错法实验,总极性表面积(TPSA)这一关键参数与溶解性、器件性能的构效关系尚未系统揭示。

为解决这一科学难题,伊玛目穆罕默德·本·沙特伊斯兰大学的研究团队创新性地将机器学习与密度泛函理论(DFT)计算相结合,通过逆向工程策略构建了包含1000种新型TPA聚合物的化学空间。相关成果发表于《Journal of Molecular Graphics and Modelling》,为高通量设计高性能光伏材料提供了范式转变。

研究采用多学科交叉方法:首先从文献库收集906个TPA化合物构建SMILES编码数据集;运用xGBoost和随机森林算法建立TPSA预测模型,通过SHAP值解析特征重要性;采用K折交叉验证和袋外评估确保模型稳健性;对优选聚合物进行DFT计算分析电子结构;最终评估光伏参数包括光捕获效率(LHIE)、开路电压(Voc
)、填充因子(FF)和短路电流密度(Jsc
)。

【Methodology】
研究团队系统收集906个TPA化合物构建标准化数据集,SMILES编码经Excel预处理后划分为训练集(75%)与测试集(25%)。通过比较多种机器学习算法,建立了TPSA预测的定量构效关系模型。

【Results and discussion】
预测模型表现出优异性能(R2
=0.93-0.96),特征分析揭示硝基数量(NOCount)对TPSA影响最大。设计的聚合物中最高TPSA达182,电子结构分析显示HOMO与LUMO呈空间分离分布,这种电荷分离特性有利于光伏性能提升。最优材料的光伏参数为:LHIE 54-79%,Voc
1.63-1.68 V,FF 0.54-0.92,Jsc
21.99-32.43 mA/cm2
,展现出商业化应用潜力。

【Conclusion】
该研究通过机器学习-DFT协同策略实现了TPA聚合物的逆向设计,建立了TPSA与分子特征的定量关系模型。不仅发现了硝基基团的关键作用,还创制出具有理想光伏性能的新材料体系。这项工作为有机光伏材料的智能化设计提供了新方法论,对推动清洁能源技术发展具有重要意义。研究揭示的分子设计原则可扩展至其他功能材料体系,其开源数据集和算法框架将为领域内后续研究提供重要参考。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号