
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的胆碱氯化物低共熔溶剂传输与热力学性质预测研究
【字体: 大 中 小 】 时间:2025年06月19日 来源:Results in Materials CS5.5
编辑推荐:
本研究针对胆碱氯化物基低共熔溶剂(DESs)的密度、粘度和离子电导率预测难题,采用随机森林(Random Forest)、XGBoost、LightGBM等机器学习(ML)模型,结合SHAP值分析揭示关键分子特征影响。结果表明集成模型预测精度最优(密度R2 =0.940,粘度R2 =0.905),为DESs工业设计提供高效计算工具。
在绿色化学和可持续材料研发领域,低共熔溶剂(DES)因其可调制的物理化学性质和环境友好特性备受关注。然而,传统实验方法筛选DES配方耗时耗力,且难以建立组分-性质的定量关系。特别是胆碱氯化物基DES作为最常用体系,其密度、粘度和离子电导率等关键参数的高通量预测仍面临挑战。
为突破这一瓶颈,研究人员开展了基于机器学习的系统性研究。通过整合582组密度、361组粘度和100余组离子电导率实验数据,结合RDKit计算的分子描述符,构建了包含线性模型、树模型和神经网络在内的10种算法体系。研究创新性地采用Stacked Models集成策略,并引入SHAP值解析特征贡献度。
关键技术方法包括:1) 通过文献挖掘构建DESs多参数数据库;2) 使用RDKit和PaDEL计算Lipinski规则相关分子描述符;3) 采用GridSearchCV和RandomizedSearchCV进行超参数优化;4) 应用3折交叉验证和适用性域(AD)分析验证模型稳健性。
【密度预测】
LightGBM模型表现最优(R2
=0.940),SHAP分析揭示辛醇-水分配系数(LogPHBD
)和氢键给体熔点(TmHBD
)是核心影响因素。温度(T)呈显著负相关,符合热膨胀物理规律。
【粘度预测】
XGBoost模型预测精度最高(R2
=0.905),特征重要性分析显示氢键给体分子量(MWHBD
)与粘度正相关,而温度升高显著降低粘度,与阿伦尼乌斯方程一致。
【离子电导率】
Stacked Models展现最强预测能力(R2
=0.722),学习曲线表明LightGBM在有限数据下仍保持稳定性能。TmHBD
与电导率负相关,提示低熔点组分有利于离子迁移。
该研究首次系统评估了多种ML算法在DESs多性质预测中的表现,证实集成学习方法可有效捕捉DESs的复杂构效关系。通过SHAP值解析建立的分子设计规则,为定向开发高性能DESs提供了理论指导。特别是对工业应用关键的粘度-温度关系建模,解决了传统QSPR方法难以处理的非线性问题。研究结果发表于《Results in Materials》,为绿色溶剂计算开发建立了新范式。
值得注意的是,尽管离子电导率数据集较小,但通过特征工程和模型集成仍获得可用精度,这种小数据建模策略对稀有材料研究具有借鉴意义。未来可通过扩展数据库和引入量子化学描述符进一步提升模型泛化能力。
生物通微信公众号
知名企业招聘