
-
生物通官微
陪你抓住生命科技
跳动的脉搏
超临界CO2中药物溶解度的机器学习预测:纳米药物绿色制备的关键突破
【字体: 大 中 小 】 时间:2025年08月23日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对药物溶解度预测难题,通过机器学习模型(ARD/GPR/LR)结合超临界CO2技术,实现了小分子药物苯妥英溶解度的精准预测(R2达0.99644)。研究创新性地采用Jellyfish优化器和Adaboost集成方法,为纳米药物绿色制备提供了高效计算工具,解决了传统热力学模拟的局限性。
在制药工业中,药物溶解度是决定其生物利用度的关键因素,但传统方法如无定形固体分散体(ASD)和共结晶技术存在成本高、工艺复杂等问题。尤其对于苯妥英等难溶性药物,如何在环保的超临界CO2系统中精确预测溶解度,成为纳米药物绿色制备的核心挑战。
为突破这一瓶颈,Hashem O. Alsaab和Yusuf S. Althobait团队在《Scientific Reports》发表研究,创新性地将机器学习与超临界流体技术结合。研究采集了313-345K温度范围和95-250bar压力下的苯妥英溶解度数据,通过三种核心算法构建预测模型:自动相关确定回归(ARD)用于特征选择,高斯过程回归(GPR)处理非线性关系,线性回归(LR)建立基础参照。研究采用Adaboost集成技术增强模型鲁棒性,并引入仿生学启发的Jellyfish优化器(JO)进行超参数调优。
模型构建与验证
通过5折交叉验证显示,ADA-GPR模型对溶解度的预测R2达0.99452±0.00183,MAPE(平均绝对百分比误差)仅4.879%。如图1所示,温度与压力的协同效应通过直方图可视化,而图2-3的残差分析证实预测值与实验值高度吻合。
关键发现
温度效应:如图4所示,在固定压力下,溶解度随温度升高而增加,这与溶剂密度降低的趋势(图5)形成有趣对比,表明分子间相互作用而非单纯溶剂密度主导溶解过程。
压力影响:所有模型均证实压力与溶解度呈正相关,250bar时溶解度较95bar提升300%,这为超临界工艺参数优化提供依据。
泛化能力:如表2所示,模型在15种药物(如阿那曲唑、克唑替尼等)的450+数据点中保持R2>0.94,证明其广泛适用性。
技术亮点
研究采用Min-Max归一化预处理数据,80/20划分训练测试集。ARD回归通过贝叶斯框架实现特征权重自动分配,其核心方程y=wTx+ε有效降低过拟合风险。GPR模型利用核函数捕捉非线性特征,而JO算法通过模拟水母群体行为实现高效参数优化。
结论与展望
该研究首次将仿生优化算法与机器学习结合用于超临界药物溶解度预测,ADA-GPR模型对苯妥英的预测精度达99.6%。这不仅解决了传统热力学模型需要预设相互作用参数的局限,更为纳米药物绿色制备提供了可扩展的计算框架。如图6所示,模型在跨药物预测中的卓越表现,预示着其在个性化药物配方设计中的巨大潜力。未来工作可进一步探索该模型在蛋白质药物等大分子体系中的应用。
生物通微信公众号
知名企业招聘