基于先验知识与快速适应图神经网络的跨临床前与临床数据药物反应预测模型metaDRP研究

【字体: 时间:2025年07月05日 来源:Journal of Pharmaceutical Analysis 6.1

编辑推荐:

  为解决药物反应预测(DRP)中数据稀缺和分布外(OOD)泛化难题,研究人员开发了元学习框架metaDRP,整合图神经网络(GNN)与注意力机制,在GDSC和体内数据集中实现媲美SOTA模型的预测性能,同时提供药物作用机制(MoA)的可解释性分析,为精准肿瘤学提供新工具。

  

药物开发领域长期面临两大瓶颈:临床药基因组数据稀缺导致模型训练困难,以及临床前模型与人体肿瘤间的生物学差异造成预测失效。现有计算方法如单药学习模型(MOLI、DeepDR)和多药学习框架(GraphCDR、TGSA)虽各有优势,但难以兼顾小样本适应性和跨数据集泛化能力。更关键的是,传统"黑箱"模型缺乏解释临床决策所需的生物学依据,严重阻碍了转化应用。

针对这些挑战,中国的研究团队在《Journal of Pharmaceutical Analysis》发表研究,提出创新性少样本学习模型metaDRP。该工作通过三个关键设计突破现有局限:采用模型无关元学习(MAML)框架构建药物-组织对任务单元,实现样本高效利用;整合预训练Graphormer药物编码器与多尺度生物特征聚合架构,增强跨模态表征;引入自注意力与交叉注意力机制,提供通路级作用机制解释。研究证实metaDRP在GDSCv1数据集上SCCd达0.6316,显著优于TGSA等基准模型,且在PDTX和TCGA临床数据中保持优异迁移性能。

关键技术方法包括:1) 基于DepMap和GDSCv1构建4,446个KEGG通路基因的多组学数据集;2) 采用特征传播算法处理40%以上缺失值的多组学数据;3) 使用ZINC 250k预训练Graphormer药物编码器;4) 设计双分支架构(细胞系GCN通路编码器+药物图Transformer);5) 实施两阶段MAML训练(2次内环更新+余弦衰减学习率)。

【模型性能验证】
通过系统基准测试发现:在GDSCv1的273种药物预测中,metaDRP的10-shot SCCdt达0.536±0.022,较传统方法提升12%。特别在微管抑制剂(如埃博霉素B)和PI3K/mTOR靶向药预测中表现突出,归因于注意力机制成功捕获tubulin结合域特征。

【跨域迁移能力】
在PDTX乳腺癌模型的976个药物-模型对测试中,5-shot学习使SCCt从0.3828提升至0.5397。TCGA数据集分析显示,对顺铂(cisplatin)的预测ROC_AUC达0.724,显著区分应答组(PR/CR)与非应答组(PD/SD)。

【机制解释性】
通过稀疏线性层权重分析,在50个肺腺癌(LUAD)细胞系中,31个样本正确识别培美曲塞(pemetrexed)靶点DHFR及其叶酸合成通路。埃博霉素B的TNBC模型解释中,5/10样本精准定位微管蛋白基因TUBA1B/TUBB。

该研究的重要意义在于:首次将元学习框架系统应用于DRP领域,通过药物-组织任务设计有效缓解数据碎片化问题;创新的多尺度生物特征聚合架构实现从基因到通路的层级解释;临床验证表明模型能跨越"体外-体内"鸿沟,为个性化治疗提供可靠的计算工具。未来工作需进一步整合肿瘤微环境特征,以提升对CNS等复杂组织的预测性能。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号