
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于AdaBoost集成学习与黑寡妇优化算法的超临界CO2中药溶解度预测模型研究
【字体: 大 中 小 】 时间:2025年06月04日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对传统热力学模型难以泛化预测不同药物在超临界CO2(SC-CO2)中溶解度的问题,开发了结合黑寡妇优化算法(BWOA)的AdaBoost-GPR混合机器学习模型。该模型通过温度、压力双变量输入,实现了SC-CO2密度(R2=0.98670)和尼氟酸溶解度(R2=0.98661)的高精度预测,为绿色制药工艺优化提供了新工具。
在绿色制药技术领域,超临界二氧化碳(SC-CO2)因其无毒、不可燃且可循环的特性,成为替代有机溶剂的理想选择。然而,药物在SC-CO2中的溶解度数据获取依赖耗时费力的实验测定,传统热力学模型又存在难以泛化到不同药物分子的问题。特别是尼氟酸等非甾体抗炎药的溶解度预测,直接影响纳米药物颗粒制备工艺的优化效率。
上海海关学院的研究团队在《Scientific Reports》发表论文,创新性地将生物启发算法与集成学习相结合。通过开发ADA-GPR(基于高斯过程回归的AdaBoost)、ADA-ARD(自动相关性检测回归)和ADA-BRR(贝叶斯岭回归)三种混合模型,并采用黑寡妇蜘蛛交配行为启发的BWOA算法进行超参数优化,构建了可同时预测SC-CO2密度和药物溶解度的智能系统。研究使用包含温度(313-343K)、压力(16-40MPa)、密度(595-1000kg/m3)和溶解度(0.657-6.06)的四维数据集,通过10折交叉验证证实了模型的鲁棒性。
关键技术包括:1)基于蜘蛛交配行为的BWOA优化器;2)集成AdaBoost框架的三种回归算法(GPR/ARD/BRR);3)采用平均绝对相对偏差百分比(AARD%)等指标评估性能;4)通过响应面分析可视化变量交互效应。
结果分析
SC-CO2密度预测:ADA-GPR表现最优,测试集R2达0.9867,显著优于ADA-ARD(0.94166)和ADA-BRR(0.94301)。如图3所示,预测值与实验值高度吻合,最大误差仅30.66kg/m3。
尼氟酸溶解度预测:如图4所示,ADA-GPR的测试集AARD%低至9.14587,较传统PR模型(R2=0.969)精度提升17.6%。三维响应面(图10)显示溶解度随压力升高而增加,但在温度>330K时增速减缓。
变量影响机制:单变量分析(图5-8)表明,SC-CO2密度与压力正相关,与温度负相关;而溶解度受双变量协同影响,在P=40MPa、T=313K时达到峰值6.06。这与超临界流体压缩特性和分子运动理论相符。
该研究突破了传统模型对特定溶质的依赖性,开发的ADA-GPR模型对SC-CO2密度和药物溶解度的预测误差分别低于1.37%和9.15%。其创新性体现在:1)首次将BWOA应用于制药过程优化;2)建立可扩展的溶解度预测框架;3)通过响应面分析揭示工艺参数交互规律。这些成果为连续化生产纳米药物提供了关键理论支撑,对推动绿色制药技术工业化具有重要价值。未来可通过纳入更多药物分子数据进一步提升模型泛化能力。
生物通微信公众号
知名企业招聘