基于人工智能模型优化的多溶剂药物结晶分析:水杨酸溶解度预测与制药应用

【字体: 时间:2025年06月05日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对药物结晶过程中溶解度预测的复杂性问题,采用机器学习(ML)技术构建了水杨酸在多种溶剂中的溶解度预测模型。研究团队通过隔离森林(iForest)异常检测和树结构Parzen估计器(TPE)超参数优化,结合Bagging集成方法(BAG-DT/BAG-BRR/BAG-WLS),显著提升了预测精度。结果表明,BAG-DT模型在训练集(R2 =0.998)、验证集(R2 =0.973)和测试集(R2 =0.991)中均表现最优,误差率最低(MAE=5.26×10-3 )。该研究为制药结晶工艺设计提供了可扩展的智能化解决方案。

  

在制药工业中,药物结晶是决定药品纯度、稳定性和生物利用度的关键步骤。然而,传统方法依赖试错实验来确定溶解度曲线,不仅耗时耗力,还难以应对多溶剂体系的复杂相互作用。如何通过溶剂组成、温度和压力的精确调控实现可控结晶,一直是困扰研究人员的难题。沙特国王大学的研究团队在《Scientific Reports》发表的最新研究,通过人工智能技术破解了这一困局。

研究团队聚焦水杨酸(模型药物)在15种溶剂混合体系中的溶解度预测,构建了包含217个数据点的多维数据集。采用隔离森林(iForest)算法清洗异常数据,通过树结构Parzen估计器(TPE)优化三大基础模型——贝叶斯岭回归(BRR)、决策树回归(DT)和加权最小二乘回归(WLS)的超参数,最终采用Bagging集成方法提升模型鲁棒性。

数据集与预处理
数据集包含温度(T)、压力(P)及13种溶剂成分(X2
-X14
)共15个特征。Spearman热图分析揭示了溶剂成分间的非线性关联,其中水(X2
)、乙醇(X3
)和PEG300(X5
)呈现显著相关性。

模型性能对比
BAG-DT模型展现出压倒性优势:训练集R2
达0.998,测试集RMSE仅7.52×10-3
,较BAG-BRR(RMSE=2.83×10-2
)提升275%。特征重要性分析显示,水浓度(X2
)对溶解度呈负向影响(反溶剂效应),而乙醇(X3
)和PEG300(X5
)则显著促进溶解。

溶解度规律可视化
三维曲面图揭示关键规律:

  • 水(X2
    )浓度超过阈值后出现溶解饱和现象
  • 温度(T)与压力(P)均呈现线性正相关
  • 乙醇(X3
    )在40-60%浓度区间存在溶解拐点

这项研究开创性地将TPE超参数优化与Bagging集成相结合,为复杂溶剂体系的结晶工艺开发提供了标准化建模框架。其意义不仅限于水杨酸——通过替换训练数据,该模型可扩展至其他药物分子,有望加速制药行业的数字化转型升级。研究揭示的"水-乙醇-PEG300"三元溶剂相互作用机制,更为新型结晶剂设计提供了理论依据。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号