利用光吸收作为主要筛选标准,通过机器学习和密度泛函理论(DFT)加速新型有机光伏染料(OPVs)的发现

《RSC Advances》:Accelerated discovery of new organic photovoltaic dyes for OPVs using light absorbance as the primary screening criterion via machine learning and DFT

【字体: 时间:2025年11月24日 来源:RSC Advances 4.6

编辑推荐:

  本研究通过机器学习(如XGBoost和随机森林)预测有机染料在不同溶剂中的光吸收特性,结合密度泛函理论(DFT)和时依赖性DFT(TD-DFT)计算验证,开发了高效有机光伏染料。利用Transformer-Assisted Orientation(TAO)方法设计出具有高光吸收效率(LHE达95%)、峰值开路电压(Voc达0.96 V)和短路电流密度(Jsc达28.75 mA cm-2)的新染料。揭示了极性表面面积(PSA)等分子特征对光吸收的关键影响,建立了数据驱动的光伏材料设计框架。

  在当今能源需求不断增长和环境问题日益严峻的背景下,开发高效的太阳能技术成为了全球科研的重点方向之一。有机光伏材料因其独特的物理化学性质,如轻质、柔性以及低成本的制造潜力,展现出广阔的应用前景。这项研究旨在利用先进的机器学习(ML)方法,对有机染料在不同有机溶剂中的光吸收特性进行系统分析,并进一步探索其在新型太阳能材料设计中的应用潜力。通过结合多输出高斯过程回归和集成学习方法,如XGBoost与随机森林回归器,研究人员成功预测了染料在特定溶剂中的吸收性能,从而为光能转化效率的提升提供了新的思路。

光吸收特性对于有机光伏材料至关重要,因为它直接影响材料对太阳光谱的利用率以及最终的光电转换效率。在传统实验方法之外,机器学习为这一领域带来了革命性的进展,使研究人员能够在不依赖大量实验数据的情况下,快速筛选和优化具有理想光吸收特性的材料。通过构建一个包含约70,000种有机染料的数据库,该研究涵盖了多种化学类别,如吲哚、苯并噻唑、苯并菲烯、苯并噻唑、苯并二噻吩和咔唑等。这不仅扩大了研究的覆盖范围,还提高了模型的泛化能力,使其能够适应不同的化学环境。为了确保数据的可靠性,研究团队从多个公开化学数据库和文献中收集数据,并通过严格的筛选标准确保每种分子都具备与光伏应用相关的光吸收特性。

在研究中,溶剂选择是优化染料性能的关键因素之一。通过计算和分析溶剂与染料之间的相互作用,研究团队识别出了一些对染料溶解度和吸收能力有显著影响的溶剂。例如,乙醇和二氯甲烷(DCM)表现出较高的Δlog P值,表明它们能够提供良好的溶剂环境,促进染料的溶解和光吸收。而水则显示出较大的负Δlog P值,意味着其对这类染料的溶解能力较差。此外,乙腈(ACN)因其在预测中展现出较高的吸收能力,被认为是一个极具潜力的溶剂。这些发现不仅为染料与溶剂的配对提供了理论依据,也为后续实验研究提供了重要参考。

在机器学习模型的构建过程中,研究团队采用了一系列先进的方法,包括多输出高斯过程回归和集成学习模型。其中,XGBoost表现出卓越的预测能力,能够准确地识别出影响染料吸收性能的关键分子特征。通过SHAP分析,研究团队进一步揭示了这些特征的重要性,发现极性表面积(PSA)是最关键的分子描述符。这一发现对于指导新型染料的设计具有重要意义,因为极性表面积直接影响分子在溶剂中的溶解度和光吸收特性。通过将这些分子描述符与机器学习模型结合,研究团队成功预测了染料在不同溶剂中的吸收行为,并为后续的结构优化提供了理论支持。

在设计新型染料的过程中,研究团队开发了一种称为“Transformer-Assisted Orientation(TAO)”的方法。该方法通过多轮迭代设计,生成了三种不同的染料结构,为研究提供了丰富的实验数据。为了确保新设计的染料具有实际应用价值,研究团队对其进行了多方面的验证,包括化学有效性、合成可及性(SA)以及与后续TD-DFT计算结果的一致性。这些验证步骤确保了新设计的染料不仅在理论上具有优越的光吸收性能,而且在实际合成中也具备可行性。此外,新设计的染料在多个溶剂中表现出良好的溶解度和吸收能力,这表明其在不同环境下的适应性较强,具有广泛的应用潜力。

为了进一步验证新设计染料的性能,研究团队采用了密度泛函理论(DFT)和时间依赖密度泛函理论(TD-DFT)进行计算。这些计算方法能够精确地模拟染料的电子结构和光谱特性,从而提供关于其光电性能的深入见解。在计算过程中,研究团队采用了ωB97XD/LanL2DZ和CAM-B3LYP/6-31G+(d,p)等方法,以确保计算结果的准确性和可靠性。由于计算成本较高,仅对新设计的约1150种染料进行了详细的DFT/TD-DFT分析,而不是对整个数据库进行计算。这种策略不仅提高了计算效率,还保证了对关键候选染料的深入研究。

研究团队还利用特征选择方法对大量的分子描述符进行了优化,以提高模型的预测精度。通过消除方差接近于零的特征,并保留相关性大于0.95的特征,最终筛选出35个具有代表性的分子描述符,涵盖了结构、电子和极性等关键属性。这些特征的选取使得机器学习模型能够更准确地预测染料的吸收性能,并为后续的材料设计提供指导。此外,通过分析特征的重要性,研究团队明确了哪些分子属性对光吸收特性具有决定性影响,从而为未来的研究方向提供了参考。

研究团队还通过计算多个化学反应参数,如电离势(IP)、电子亲和力(EA)、电负性(χ)、化学势(μ)、硬度(η)和亲电性指数(ω),对染料的化学反应特性进行了深入分析。这些参数不仅有助于理解染料在不同环境下的行为,还为优化其光电性能提供了理论依据。例如,某些染料表现出较高的亲电性指数,意味着它们在化学反应中具有更强的电子接受能力,这对于构建高效的光电材料具有重要意义。通过分析这些参数,研究团队能够更全面地评估染料的化学行为,并为其在实际应用中的性能提供预测支持。

在光吸收预测方面,研究团队采用的XGBoost和随机森林模型均表现出优异的预测能力。XGBoost的R2值达到0.92,而随机森林的R2值为0.87,表明这些模型能够有效捕捉染料吸收特性与分子结构之间的复杂关系。同时,模型的均方根误差(RMSE)较低,进一步验证了其预测的准确性。这些结果不仅展示了机器学习在光吸收预测方面的强大能力,也为未来的研究提供了新的工具和方法。通过分析残差分布,研究团队发现XGBoost在处理数据集的广泛变化方面表现出更强的适应性,而随机森林则在预测稳定性方面更优。这种模型的比较有助于选择最适合当前研究需求的算法,为后续的材料设计和优化提供了参考。

在研究过程中,研究团队还采用了t-SNE等数据可视化方法,以揭示高维数据的内在结构和模式。这些可视化结果表明,不同染料在分子特性上的分布具有一定的规律性,有助于识别具有相似特性的染料群体。此外,通过分析TDM热图,研究团队进一步验证了染料的电子激发特性。对于某些染料,TDM热图显示出强烈的非对角线强度,表明其电子激发具有显著的电荷转移特征,这对光能转化效率具有积极影响。相比之下,其他染料则表现出更局部的激发模式,这可能限制了其在光能转化中的应用潜力。

研究团队还通过计算多种光光伏参数,如开路电压(Voc)、填充因子(FF)、短路电流密度(Jsc)和光捕获效率(LHE),评估了新设计染料的性能。其中,染料1在这些参数中表现出色,其LHE达到95%,Voc为0.96 V,FF为0.87,Jsc为28.75 mA cm?2。这些数值表明,该染料在太阳能转化方面具有极大的潜力。然而,染料6则表现出较差的性能,其LHE仅为15%,Jsc也远低于其他染料,这提示在进一步优化过程中需要关注其结构特性。通过分析这些参数,研究团队不仅能够评估染料在实际应用中的表现,还能为后续的实验合成和设备集成提供指导。

本研究的一个重要成果是建立了一个集成的ML/DFT计算框架,为有机光伏材料的设计和优化提供了系统的方法。该框架不仅能够高效预测染料的吸收特性,还能通过DFT和TD-DFT计算验证其电子结构和光谱特性。这种结合为研究人员提供了一种快速、精确且经济的材料筛选方法,有助于减少实验成本并提高研发效率。此外,该框架的建立也为未来的材料研究提供了参考,使得研究人员能够基于数据驱动的方法,设计出性能更优的有机光伏材料。

研究团队的发现表明,有机染料的光吸收特性与其分子结构密切相关,特别是极性表面积、分子量和溶剂的极性特性。通过这些参数的优化,研究人员能够设计出具有更高吸收效率的染料,从而提升有机光伏器件的整体性能。此外,研究还强调了溶剂选择在材料性能优化中的重要性,通过对比不同溶剂对染料吸收能力的影响,为实际应用中的溶剂配比提供了科学依据。

本研究不仅在理论层面提供了重要的见解,也在实际应用中展现了其价值。通过机器学习模型的预测和DFT计算的验证,研究人员能够设计出性能优越的新型染料,并评估其在不同环境下的适用性。这种数据驱动的方法不仅提高了材料设计的效率,也为太阳能技术的可持续发展提供了新的思路。未来,随着更多数据的积累和计算方法的改进,这一研究框架有望在更广泛的材料体系中得到应用,推动太阳能技术的进一步创新和发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号