
-
生物通官微
陪你抓住生命科技
跳动的脉搏
离子液体-离子液体-水三元混合物密度与粘度的机器学习联合基团贡献法建模研究
【字体: 大 中 小 】 时间:2025年09月20日 来源:Fluid Phase Equilibria 2.7
编辑推荐:
本综述重点探讨了结合机器学习(ML)与基团贡献法(GC)在离子液体(IL)三元体系物性建模中的前沿应用。研究通过人工神经网络(ANN)、XGBoost和LightGBM算法,实现对IL-IL-H2O体系密度与粘度的高精度预测(如密度R2达0.9963),并借助SHAP分析阐释特征贡献,为工业溶剂设计与绿色化工过程优化提供重要理论工具。
数据库开发 (Database development)
机器学习(ML)模型的准确性和泛化能力深受数据体量与多样性的影响。本研究中的离子液体-离子液体-水(IL-IL-H2O)三元体系密度与粘度数据源自NIST标准参考数据库,均基于实验测量获得。数据经过进一步处理,剔除了缺失或异常信息,从而提升其可靠性。对于粘度数据,我们对其温度、压力和粘度值进行了统一处理。
GC方法 (GC method)
基团贡献(GC)法在本研究中作为核心工具,用于建立分子结构与理化性质之间的关联。其核心作用是将复杂离子液体(IL)分子拆解为具有明确化学意义的官能团,并通过量化各官能团对体系密度与粘度的贡献,实现对IL-IL-H2O三元混合物性质的预测。该方法具有两大显著优势:首先……(此处原文未完整展开)
密度 (density)
表7比较了三种算法在预测IL-IL-H2O三元体系密度时的性能。结果显示所有模型均表现优异,证实了GC与ML相结合可精准预测该三元体系的密度性质。所有模型在训练集上均展现出卓越性能,R2值均超过0.98。此外,所有模型的AARD%均低于1%,进一步表明模型在训练阶段表现极佳。
结论 (Conclusion)
本研究成功将三种先进机器学习算法——人工神经网络(ANN)、XGBoost和LightGBM——与GC方法相结合,用于建模IL-IL-H2O三元混合物的密度与粘度。通过利用大量实验数据,为这些复杂体系开发了稳健的ML-GC模型。研究分析了三种数据集划分策略对预测性能的影响,并在原模型中引入5折交叉验证以进一步验证其……(此处原文未完整展开)
生物通微信公众号
知名企业招聘