
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于因果启发的图神经网络PDGrapher实现疾病表型逆转的组合扰动预测
【字体: 大 中 小 】 时间:2025年09月10日 来源:Nature Biomedical Engineering 26.6
编辑推荐:
本研究针对表型驱动药物发现中"如何直接预测逆转疾病状态的组合治疗靶点"这一核心问题,开发了因果启发的图神经网络PDGrapher。该方法通过嵌入疾病细胞状态到基因互作网络,直接预测最优组合扰动(perturbagens),在9种细胞系的化学扰动测试中比现有方法多识别13.37%的有效靶点,训练速度提升25倍,为精准医疗提供了可扩展的计算框架。
在药物研发领域,表型驱动与靶向驱动两种策略长期并存。虽然靶向BCR-ABL的伊马替尼等"一药一靶"策略取得显著成功,但1999-2008年间美国FDA批准的首创药物中,多数是通过表型筛选而非预设靶点发现的。这种表型驱动方法面临核心挑战:现有技术只能通过穷举法预测扰动响应,无法直接推断实现特定表型逆转所需的治疗靶点组合。传统方法如Connectivity Map(CMap)和LINCS数据库虽提供大量基因表达谱,但仅限于从预定义库中选择扰动因素。更关键的是,这些方法需要为每个扰动训练独立模型,当面对LINCS数据库中数千种扰动时,计算成本呈指数级增长。
针对这些瓶颈,由Guadalupe Gonzalez、Xiang Lin等国际团队在《Nature Biomedical Engineering》发表的研究,创新性地将因果推理与几何深度学习相结合。研究人员构建了PDGrapher(Phenotype-Driven Graph neural network for perturbagen prediction)系统,包含扰动发现模块fp和响应预测模块fr两个核心组件。关键技术包括:1)使用STRING数据库的蛋白互作网络(PPI)和GENIE3构建的基因调控网络(GRN)作为代理因果图;2)基于LINCS数据库的19个数据集,涵盖11种癌症类型和2种干预方式(化学/遗传);3)采用交叉熵循环损失和监督损失的双重优化策略;4)设计网络邻近性评估指标,量化预测靶点与真实靶点在PPI中的最短路径距离。
研究结果通过多维度验证展现出突破性性能:
"PDGrapher预测逆转疾病状态的扰动组合"部分显示,在化学-PPI数据集测试中,PDGrapher在A549肺癌细胞等9种细胞系均优于基线方法,nDCG值最高提升0.13,准确预测样本比例平均提高8.58%。特别值得注意的是,预测靶点在PPI网络中与真实靶点的平均最短路径距离为2.77,显著优于随机预期的3.11(P<0.001)。
"模型泛化能力验证"部分通过leave-cell-out实验设计证实,在训练集未包含的细胞系中,PDGrapher仍能识别8.67%更多有效靶点。对PPI网络结构的敏感性分析表明,即使移除50%的边(保留296,451条边),模型性能降幅不足5%,体现算法鲁棒性。
"临床转化价值验证"部分最具说服力:在预测A549肺癌细胞的治疗靶点时,PDGrapher将临床药物普拉替尼(pralsetinib)的主要靶点RET排在第11位(共10,716个基因),其11个已知靶点中有5个进入前100名。更引人注目的是,PDGrapher独立预测的血管内皮生长因子受体2(KDR)与临床研究高度吻合——抑制KDR可下调EZH2表达,增强化疗敏感性,这与其在预测排名第3的结果完全一致。
讨论部分强调了方法学的双重革新:在理论上,首次将最优干预设计(optimal intervention design)问题转化为表示学习任务;在应用上,突破现有技术必须枚举所有扰动响应的局限。研究还揭示了PPI网络局部性假说的新证据——功能相关基因在网络中的邻近性可提升预测准确性。局限性方面,作者指出对未观测混杂因素的敏感性,以及NL20与A549细胞系解剖学来源差异可能引入的偏差。
这项研究为精准医疗提供了可扩展的计算框架,其预测结果与临床证据的高度一致性,预示着人工智能在药物重定位和组合疗法设计中的广阔前景。特别在肿瘤异质性应对方面,PDGrapher直接预测患者特异性靶点组合的能力,可能为克服耐药性提供新思路。随着JUMP Cell Painting等多组学数据库的整合,该方法有望进一步突破转录组数据的局限,实现真正的多模态表型驱动发现。
生物通微信公众号
知名企业招聘