富勒烯衍生物在氯苯中的溶解度的计算机模拟研究
《Results in Chemistry》:In silico study of the solubility of fullerene derivatives in chlorobenzene
【字体:
大
中
小
】
时间:2025年10月02日
来源:Results in Chemistry 4.2
编辑推荐:
全氟碳烯(FDs)的溶解性预测及其在材料设计中的应用,通过开发线性与非线性QSPR模型,结合机器学习算法和分子 descriptors,验证了模型在 chlorobenzene 中的预测能力,并明确了适用性域。摘要:本研究基于QSPR方法,开发了线性(OLS)与非线形(CPANN)机器学习模型,预测全氟碳烯(FDs)在氯苯中的溶解度。通过实验数据验证,模型展现出高准确性和鲁棒性(R2>0.75,RMSE<0.2),并成功外推至117种新FDs,揭示了分子拓扑、电子分布及三维空间结构对溶解性的影响,为材料设计与合成优化提供工具。
### 全氟化物在氯苯中的溶解性预测研究
近年来,随着对碳纳米材料研究的深入,富勒烯(Fullerene)及其衍生物在多个领域展现出广泛的应用潜力,包括光电子、化妆品、生物医学和可再生能源。其中,富勒烯C60因其独特的π共轭系统和球形结构,成为最具有代表性的零维碳材料之一。然而,C60在极性溶剂中的溶解性问题一直困扰着其实际应用。为了更好地理解富勒烯衍生物(Fullerene Derivatives, FDs)在不同溶剂中的溶解性,科学家们利用定量结构-性质关系(Quantitative Structure-Property Relationship, QSPR)方法,结合机器学习技术,开发了预测模型,以评估其在氯苯中的溶解性。这些模型不仅有助于理解FDs的溶解性特征,还为未来的新材料设计和工业应用提供了重要的参考依据。
### 富勒烯及其衍生物的背景与研究意义
富勒烯C60是由60个sp2杂化的碳原子组成的球形分子,具有独特的电子结构和化学性质。由于其结构的特殊性,C60在许多有机溶剂中表现出良好的溶解性,尤其是芳香族溶剂如氯苯、甲苯、氯仿和苯。然而,其在极性溶剂中的溶解性却较为复杂,限制了其在某些领域的应用。因此,对FDs溶解性的深入研究显得尤为重要。富勒烯衍生物通常通过在C60或C70核心结构上引入不同的功能基团来合成,这些功能基团通常通过环丙烷基团连接到富勒烯的表面。不同的功能基团不仅影响FDs的溶解性,还对其在环境中的分布和生物累积性产生重要影响。
在工业和科研领域,FDs的溶解性是其应用效果的关键因素之一。特别是在有机电子领域,FDs的溶解性决定了其在溶液中的加工性能,进而影响最终产品的性能。因此,研究FDs在氯苯等有机溶剂中的溶解性,不仅有助于理解其在环境中的行为,还为材料设计和合成提供了指导。
### 研究方法与模型构建
为了预测FDs在氯苯中的溶解性,本研究采用了多种机器学习方法。首先,从文献中收集了27种FDs在氯苯中的实验溶解性数据。随后,利用普通最小二乘法(Ordinary Least Squares, OLS)方法构建了两个线性QSPR模型,分别命名为Model 1和Model 2。这些模型基于不同的分子描述符,如MATS5m、MATS4i、P_VSA_ppp_ar、RDF080i、Mor09i等,这些描述符反映了分子结构、电子性质和空间分布等特征。
此外,还构建了一个非线性QSPR模型,即反向传播人工神经网络(Counter Propagation Artificial Neural Network, CPANN)。该模型使用了与Model 2相同的描述符,并通过调整神经元配置和训练周期,优化了模型的预测能力。最终选择了一个6×6神经元架构,经过800次训练后,获得了最佳的预测效果。
为了确保模型的可靠性,研究过程中采用了多种验证方法。其中包括内部验证(如R2、调整R2、均方根误差RMSE和一致性相关系数CCC)和外部验证(如Q2_F1、Q2_F2、Q2_F3和r2_m)。同时,还通过Williams图和Insubria图评估了模型的适用域(Applicability Domain, AD),以确保预测结果仅适用于与训练数据结构相似的化合物。
### 模型的性能与适用性分析
Model 1和Model 2的内部验证结果显示,它们的R2分别为0.833和0.822,调整R2分别为0.790和0.777,均表明模型具有较高的解释能力。同时,模型的RMSE分别为0.177和0.170,说明模型在训练集上的预测误差较小。对于外部验证,Model 1的R2_test为0.786,RMSE_test为0.130,而Model 2的R2_test为0.823,RMSE_test为0.168。这些结果表明,两个模型在预测未知FDs的溶解性方面都表现出良好的性能。
CPANN模型的性能同样优异,其在训练集上的R2为0.93,RMSE为0.256,而在测试集上的Q2为0.83,RMSE为0.592。此外,交叉验证(Leave-One-Out Cross-Validation, LOO-CV)结果表明,CPANN模型的回归系数达到了0.943,显示出其在预测溶解性方面的强大能力。通过将模型的预测值与实验值进行对比,可以发现CPANN模型在多个FDs的溶解性预测中表现稳定。
在适用域分析中,Model 1和Model 2的hat值(h*)分别为0.714,任何FDs的hat值若超过该临界值,则可能超出模型的适用范围。CPANN模型则通过计算化合物与平均描述符向量之间的欧几里得距离(Euclidean Distance, ED)来确定其适用域。在CPANN模型中,ED的最高值为3.5,最低值为0.733,因此,任何ED大于3.5的化合物都被认为超出了模型的适用范围。
### 溶解性预测的应用与意义
通过这些模型,研究人员能够预测117种未知溶解性的FDs在氯苯中的溶解性。其中,某些FDs仅能被Model 1或Model 2预测,而另一些则可以同时被两个模型预测。这一结果表明,不同的描述符对溶解性预测的贡献不同,从而影响了模型的适用性。对于某些具有复杂结构的FDs,其预测结果可能超出模型的适用范围,因此需要谨慎对待。
例如,研究中提到的PCBM(phenyl-C61-butyric acid methyl ester)是富勒烯衍生物中广泛研究的一种,其在氯苯中的实验溶解性为0.0549 M(对应?Log S值为1.26)。通过Model 1和Model 2的预测,PCBM的溶解性分别为0.0296 M(?Log S值为1.5284)和0.0290 M(?Log S值为1.5376)。这些预测值均落在模型的适用域内,表明模型对这类化合物具有良好的预测能力。
### 结论与展望
本研究成功构建了两个线性QSPR模型和一个非线性CPANN模型,用于预测FDs在氯苯中的溶解性。这些模型不仅在训练集上表现出色,而且在测试集和外部数据集上也具有较高的预测准确性。通过适用域分析,研究人员确保了模型预测结果的可靠性,避免了对结构差异较大的化合物进行不合理的预测。
这些模型的开发为富勒烯衍生物的工业应用提供了重要的工具。它们能够帮助科学家们在不进行昂贵实验的情况下,快速评估FDs的溶解性,从而优化合成路线和材料设计。此外,模型的预测结果还可以用于理解FDs在不同溶剂中的行为,为环境评估和生物累积性研究提供支持。
未来,随着对富勒烯衍生物研究的深入,这些模型可能会被进一步优化,以适应更广泛的化合物结构。同时,研究还可以扩展到其他溶剂,如四氢呋喃、二氯甲烷和甲苯,以更全面地评估FDs的溶解性特征。此外,结合更先进的机器学习算法,如深度学习和图神经网络,可能有助于提高模型的预测能力和适用范围。
总之,本研究通过构建和验证QSPR模型,为富勒烯衍生物在氯苯中的溶解性预测提供了重要的方法和工具。这些模型不仅有助于理解FDs的溶解性机制,还为未来的材料开发和环境评估提供了有价值的参考。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号