基于因果感知图神经网络的TP53通路功能分层与表型预测研究

【字体: 时间:2025年08月13日 来源:npj Systems Biology and Applications 3.5

编辑推荐:

  本研究通过整合数学规划与图神经网络(GNNs),开发了一种因果感知的计算框架,用于解析疾病中功能表型异质性。研究人员以TP53调控网络为模型,结合先验知识网络(PKNs)和混合整数线性规划(MILP)优化重建基因调控网络(GRNs),并利用GATv2Conv架构实现通路水平的分类。结果表明,该方法能有效区分TP53不同突变类型的功能特征,为精准肿瘤学提供新的生物标志物发现途径。

  

在复杂的疾病机制研究中,基因调控网络的异质性如何驱动表型多样性一直是重大科学难题。尤其对于"基因组守护者"TP53这样的关键转录因子,其突变会导致下游数百个靶基因的调控紊乱,但传统表达分析难以捕捉这种网络层面的功能变化。现有方法多局限于静态网络比较或单一组学数据分析,缺乏整合数学优化与深度学习、同时保留调控因果关系的研究框架。

研究人员开发了融合混合整数线性规划(MILP)和图神经网络(GNNs)的创新方法。通过Cancer Cell Line Encyclopedia(CCLE)和The Cancer Genome Atlas(TCGA)数据集,首先利用CARNIVAL算法将转录组数据映射到先验知识网络(PKN),重建每个样本的特异性GRN。这些网络包含约200个TP53靶基因,保留激活/抑制的调控方向(Mode of Regulation, MoR)和基因活性状态。随后采用GATv2Conv架构设计分类器,创新性地引入"聚焦机制"强化关键基因(如TP53-MYC组合)的邻域特征提取。

关键技术包括:1)基于OmniPathR构建含4万条互作的初始PKN;2)通过MILP优化实现单样本GRN重建;3)应用InfoMap社区检测和介数中心性提取突变特征;4)设计含Split MoR等6维节点特征的GNN模型;5)采用Optuna进行超参数优化。

网络分析揭示功能差异

重构的GRN显示,错义突变与野生型(WT)样本在社区结构上高度相似,而其他突变类型(如移码突变)则呈现独特拓扑特征。如图4所示,通过热图可视化各突变类型的基因活性特征,证实TP53不同变异对DNA损伤修复通路的影响存在显著异质性。

GNN分类性能验证

在TCGA数据集中,模型对WT和错义突变的分类准确率最高(图5),整体误分类率16.17%。特别值得注意的是,当加入TP53和MYC作为聚焦基因时,TCGA的分类性能提升4.5%(图10),这与其已知的拮抗调控关系相符。而CCLE细胞系数据因样本异质性较高,最佳误分类率为31.63%。

讨论与意义

该研究首次实现将整个生物通路作为单数据点进行分类的方法学突破。通过保留调控方向性和基因活性状态,GNN能够捕捉传统方法遗漏的细微功能差异。虽然对罕见突变类型的分类性能有限,但这可能反映其真实的生物学相似性——某些突变确实不引起显著表型变化。研究建立的"优化-分类"流水线具有广泛适用性,未来可扩展至其他转录因子或疾病状态(如缺氧、药物处理)的分析。

发表于《npj Systems Biology and Applications》的这项工作,为理解基因型-表型转换提供了新范式。其创新点在于:1)整合数学规划与深度学习;2)开发面向生物网络的专用GNN架构;3)建立可解释的因果推理框架。这不仅推进了对TP53突变谱系的认识,更为多因素疾病的机制解析提供了通用工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号