通过整合公共数据和专有数据来提高对吸收、分布、代谢和排泄特性的预测准确性

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《ChemMedChem》：Improving Absorption, Distribution, Metabolism, and Excretion Property Predictions by Integrating Public and Proprietary Data

【字体：大中小】 时间：2025年11月27日 来源：ChemMedChem 3.4

编辑推荐：

　　准确预测化合物ADME性质对药物研发至关重要。本研究整合内部及公共高质量ADME数据，对比单源、单任务与多任务学习模型，发现融合数据（尤其多任务模型）在公共测试集上表现更优，内部测试集误差减少显著。适用性域分析表明多任务模型对训练空间相似度高的化合物预测误差更小，泛化能力更强。预测不确定性分析验证了这一结论。研究证实，科学整合高质量公共数据与内部数据能有效提升ADME预测模型的准确性、校准度和泛化能力，为计算药物设计提供可靠支持。

摘要

准确预测化合物的性质对于通过加速流程和提高成功率来增强药物发现至关重要。本研究重点关注与吸收（Absorption）、分布（Distribution）、代谢（Metabolism）和排泄（Excretion，简称ADME）相关的关键药代动力学指标的预测，利用了大量的内部数据以及新近可用的高质量公共ADME数据。我们评估了使用单一数据源（内部或公共数据）、汇总的单任务模型和多任务模型在六个ADME指标上的数据整合策略。在结合了多种数据（尤其是多任务模型）的情况下训练的模型通常优于单一数据源的基线模型，在公共测试中表现出一致的改进效果，在内部测试中也经常取得显著提升，尤其是在公共数据与内部数据规模相当且比例平衡时。适用性领域分析表明，对于与训练数据具有较高相似性的化合物，多任务学习能够减少预测误差，说明其具有更好的泛化能力。对预测不确定性的分析也支持了这一观点。我们的研究表明，将高质量公共数据集与专有数据进行精心整合，可以生成更准确、校准更精确的计算机模拟ADME模型，从而为药物发现中的化合物设计提供有力支持。

图形摘要

通过使用多任务学习方法，利用公共数据来扩展内部化学空间可以提高模型性能、优化模型校准度，并使模型具有更广泛的适用性。

利益冲突

作者声明以下竞争性财务利益：所有作者均为德国达姆施塔特Merck Healthcare KGaA公司的雇员。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号