
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习驱动的群体药代动力学模型自动化构建:一种高效精准的药物开发新范式
【字体: 大 中 小 】 时间:2025年08月02日 来源:Communications Medicine 6.3
编辑推荐:
本研究针对传统群体药代动力学(PopPK)模型开发效率低下的问题,提出基于pyDarwin框架的自动化建模方法。研究人员构建了包含>12K种模型结构的搜索空间,开发了兼顾模型拟合度与参数合理性的惩罚函数,通过贝叶斯优化结合局部搜索算法,在48小时内即可获得与专家手动建模相当的PopPK模型。该方法在5个临床数据集验证中平均仅需评估2.6%的模型空间,显著提升了建模效率与可重复性,为加速药物研发提供了创新解决方案。
在药物研发领域,群体药代动力学(PopPK)模型犹如解码药物在人体内行为的"密码本",能够揭示药物吸收、分布、代谢和排泄(ADME)的群体特征。然而传统PopPK建模过程却面临着效率瓶颈——专家们需要像拼图一样手动尝试各种模型结构,从简单的一室模型开始,逐步添加特征直至找到最佳方案。这种"贪心算法"式的手工操作不仅耗时数周,还容易陷入局部最优解,更因研究者主观偏好导致结果可重复性降低。随着人工智能技术的发展,自动化PopPK建模的曙光初现,但现有工具存在模型空间局限、参数不合理、需要频繁人工配置等问题,犹如"带着镣铐跳舞"。
AstraZeneca的研究团队在《Communications Medicine》发表的研究中,开发了一套"开箱即用"的自动化PopPK建模方案。该方法创新性地构建了包含12,672种模型结构的搜索空间,覆盖了口服和皮下给药药物的主要特征。研究团队设计的双层惩罚函数独具匠心:AIC项防止过拟合,参数估计项则通过17个阈值确保参数生物学合理性,完美模拟了专家决策过程。通过pyDarbin框架的贝叶斯优化(随机森林代理模型)与穷举式局部搜索的组合策略,系统能在40核CPU环境下48小时内完成建模,相比传统方法实现了数量级的效率提升。
关键技术方法包括:1)构建包含3种分布模型、4种吸收机制、3种残差模型的标准化搜索空间;2)采用SAEM-IMP算法进行稳健参数估计;3)开发基于随机森林的贝叶斯优化算法;4)使用来自5个临床试验(涉及小分子药物和单抗)的数据验证。研究特别采用来自osimertinib、olaparib等药物的真实临床数据,样本量从96到296例不等。
【模型搜索效果验证】在合成数据测试中,系统完美重现了ribociclib的真实生成模型。四个临床数据集验证显示:camizestrant模型与专家结构完全一致;osimertinib模型通过增加4个转运室改善了吸收速率变异;olaparib模型虽缺少自抑制机制但仍获相似结构;tezepelumab模型改用序贯零级吸收更优。所有自动模型OFV值均优于人工模型,如osimertinib降低962点(p<0.001)。
【惩罚函数关键作用】对比实验显示,仅使用AIC惩罚会导致参数异常:ribociclib吸收速率变异系数>500%,tezepelumab出现零方差估计。完整惩罚函数则确保所有参数处于生理合理范围,如清除率变异系数控制在10-131%之间(p<0.01)。
【全局搜索优势验证】局部搜索在camizestrant数据中完全失败,而全局搜索能稳定找到最优结构。PCA降维可视化显示,优质模型在特征空间形成明显聚类,证实机器学习代理模型的有效性。
这项研究实现了PopPK建模的"自动驾驶"模式:单一框架处理多种药物,无需人工配置;标准化流程提升结果可重复性;48小时快速响应满足监管时限要求。尤为重要的是,该方法发现的模型结构常超越专家预期——如为osimertinib增加转运室的创新设计,展现了AI的"想象力"。未来通过扩展模型空间(如靶向药物处置、自抑制机制),该方法有望覆盖90%以上的PopPK建模需求。这项技术不仅将建模时间从数周压缩到两天,更通过编码专家经验实现了"数字工匠精神",为模型引导的药物开发(MIDD)树立了新标杆。
生物通微信公众号
知名企业招聘