
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于人工智能模型优化的多溶剂药物结晶分析:水杨酸溶解度预测与制药应用
【字体: 大 中 小 】 时间:2025年06月05日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对药物结晶过程中溶解度预测的复杂性问题,采用机器学习(ML)技术构建了水杨酸在多种溶剂中的溶解度预测模型。研究团队通过隔离森林(iForest)异常检测和树结构Parzen估计器(TPE)超参数优化,结合Bagging集成方法(BAG-DT/BAG-BRR/BAG-WLS),显著提升了预测精度。结果表明,BAG-DT模型在训练集(R2 =0.998)、验证集(R2 =0.973)和测试集(R2 =0.991)中均表现最优,误差率最低(MAE=5.26×10-3 )。该研究为制药结晶工艺设计提供了可扩展的智能化解决方案。
在制药工业中,药物结晶是决定药品纯度、稳定性和生物利用度的关键步骤。然而,传统方法依赖试错实验来确定溶解度曲线,不仅耗时耗力,还难以应对多溶剂体系的复杂相互作用。如何通过溶剂组成、温度和压力的精确调控实现可控结晶,一直是困扰研究人员的难题。沙特国王大学的研究团队在《Scientific Reports》发表的最新研究,通过人工智能技术破解了这一困局。
研究团队聚焦水杨酸(模型药物)在15种溶剂混合体系中的溶解度预测,构建了包含217个数据点的多维数据集。采用隔离森林(iForest)算法清洗异常数据,通过树结构Parzen估计器(TPE)优化三大基础模型——贝叶斯岭回归(BRR)、决策树回归(DT)和加权最小二乘回归(WLS)的超参数,最终采用Bagging集成方法提升模型鲁棒性。
数据集与预处理
数据集包含温度(T)、压力(P)及13种溶剂成分(X2
-X14
)共15个特征。Spearman热图分析揭示了溶剂成分间的非线性关联,其中水(X2
)、乙醇(X3
)和PEG300(X5
)呈现显著相关性。
模型性能对比
BAG-DT模型展现出压倒性优势:训练集R2
达0.998,测试集RMSE仅7.52×10-3
,较BAG-BRR(RMSE=2.83×10-2
)提升275%。特征重要性分析显示,水浓度(X2
)对溶解度呈负向影响(反溶剂效应),而乙醇(X3
)和PEG300(X5
)则显著促进溶解。
溶解度规律可视化
三维曲面图揭示关键规律:

这项研究开创性地将TPE超参数优化与Bagging集成相结合,为复杂溶剂体系的结晶工艺开发提供了标准化建模框架。其意义不仅限于水杨酸——通过替换训练数据,该模型可扩展至其他药物分子,有望加速制药行业的数字化转型升级。研究揭示的"水-乙醇-PEG300"三元溶剂相互作用机制,更为新型结晶剂设计提供了理论依据。
生物通微信公众号
知名企业招聘