机器学习预测基于片剂配方的药物释放曲线与动力学参数

【字体: 时间:2025年07月30日 来源:The AAPS Journal 5.0

编辑推荐:

  本研究针对直接压片(DC)技术中配方优化耗时耗力的问题,创新性地采用机器学习(ML)技术预测动态溶出条件下的药物释放曲线。研究人员通过构建包含377种配方的数据集,对比六种ML算法,发现随机森林(RF)和极限梯度提升(XGB)能有效预测释放曲线(R2达0.635±0.047),并首次提出"动力学参数预测-曲线拟合"双策略,为药物开发提供智能化解决方案。

  

在制药行业,直接压片(DC)技术因其高效低成本成为固体制剂生产的首选工艺,但配方优化过程却如同"盲人摸象"——传统方法需要反复试错,耗时数月甚至数年。更棘手的是,动态溶出试验(模拟人体胃肠道pH变化)的数据解读复杂,现有数学模型虽能拟合曲线却无法前瞻预测。这种低效模式严重拖累新药研发进度,据估算全球制药企业每年因此损失超百亿美元。

雅典国立卡波季斯特里安大学( National and Kapodistrian University of Athens )的Chrystalla Protopapa团队联合伦敦玛丽女王大学(Queen Mary University of London)的科学家们,在《The AAPS Journal》发表突破性研究。他们首次将机器学习(ML)技术引入DC配方开发,构建包含20种API(涵盖BCS四类药物)和80种辅料的377种配方数据库,通过对比六种ML算法,实现动态释放曲线的精准预测。更巧妙的是,团队创新性开发"双轨策略":既可直接预测释放曲线,也能通过预测Weibull模型和改良一级动力学参数间接拟合曲线,为研究人员提供双重技术路径。

研究采用五折交叉验证评估模型性能,主要技术路线包括:1) 建立包含pH动态变化的溶出数据集(11个时间点/480分钟);2) 对比零级、一级、Higuchi等传统模型与Weibull模型的拟合效果;3) 应用PCA分析揭示释放曲线聚类特征;4) 开发基于随机森林的多输出预测系统。

机器学习模型的直接预测效能
RF算法在预测完整释放曲线时表现最优(R2=0.635),误差仅±13.67%。当输入前240分钟数据后,所有模型预测精度显著提升(R2>0.8),揭示"半程数据预测全程"的可能性。

动力学参数预测策略
RF预测Weibull参数的R2达0.492,拟合曲线精度与直接预测相当(p>0.1),但额外提供a(时间参数)、b(形状参数)等关键动力学指标。改良一级动力学模型因引入滞后时间T,对延迟释放配方的拟合优度提升27%。

数据驱动的配方优化启示
PCA分析显示93.5%的释放曲线变异可由两个主成分解释,但不同类型配方(速释/缓释/迟释)在化学空间广泛重叠,证实传统经验法则的局限性。研究同时发现,单辅料配方的预测误差较高,提示数据集需进一步扩充。

这项研究开创性地证明ML可同时实现释放曲线预测和机制解析的双重目标。其价值不仅在于将配方开发周期从"月"缩短至"分钟"级,更通过可解释的动力学参数(如Weibull的b值反映释放机制),使"黑箱"模型转变为研发决策的透明工具。作者提出的主动学习(AL)框架设想,有望引导未来研究向"最小实验-最大信息"的智能化方向发展。正如论文强调,当传统试错法遭遇AI,制药工业正站在"数字孪生"革命的门槛上。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号