基于异质图神经网络的癌症检测新框架GNNMutation:整合DNA突变与蛋白质互作信息提升诊断效能

【字体: 时间:2025年06月05日 来源:BMC Bioinformatics 2.9

编辑推荐:

  为解决癌症早期诊断中基因突变与蛋白质互作网络整合不足的问题,土耳其博阿齐吉大学团队开发了异质图神经网络框架GNNMutation。该研究通过构建患者-蛋白质异质图,结合BM25-tf-rf特征加权与GAT模型,实现对乳腺癌等四种癌症的高精度分类(AUC达0.903),并鉴定出CASP9、ARHGEF3等关键基因,为癌症机制研究与临床诊断提供新范式。

  

癌症作为全球主要死因之一,其发生发展与基因突变导致的蛋白质功能紊乱密切相关。尽管高通量测序技术已能快速获取全外显子组数据,但如何有效整合突变信息与蛋白质相互作用网络仍是精准医疗面临的重大挑战。传统方法多采用同质图(仅包含蛋白质或患者节点)或统计学模型,难以捕捉生物系统的多层次关联。

博阿齐吉大学计算机工程系的Nuriye Ozlem Ozcan Simsek团队在《BMC Bioinformatics》发表研究,提出创新性解决方案GNNMutation。该框架首次构建包含患者和蛋白质双节点的异质图,通过定义蛋白质-蛋白质互作边(Eppi
)和突变导向边(Emut
),利用图注意力网络(GAT)实现节点信息传递,最终达到90.3%的乳腺癌分类准确率。

研究关键技术包括:1)基于UKBiobank队列构建包含1000例癌症患者与对照的样本集;2)采用BM25-tf-rf特征加权法量化基因突变重要性;3)设计最大300条蛋白-患者边的异质图结构;4)应用集成梯度(IG)解释器识别驱动基因。

结果分析
比较不同蛋白-患者边数量
测试显示连接300条突变边时性能最优,乳腺癌分类准确率达90.3%,过量连接会导致节点特征同质化。随机边策略准确率骤降至49.5%,证实突变信息整合的必要性。

算法对比
GNNMutation在四类癌症中全面超越传统方法:乳腺癌AUC 0.903(vs LR 0.722)、前列腺癌MCC 0.757(vs Model-Half 0.611)。同质图模型HomogeneousGNN完全失效(AUC≈0.5),凸显异质图结构的优势。

解释器发现
鉴定出11种文献已报道的癌症相关基因如CASP9(与乳腺癌生存相关)和ARHGEF3(前列腺癌生物标志物),同时提出PLAC8等新候选基因,部分基因的rf值差异达1.18 vs 1.03(癌症vs对照)。

模拟实验
在未知患者状态的模拟场景中,系统仍保持80%乳腺癌分类准确率,单例决策耗时36分钟,展现临床转化潜力。

结论与意义
该研究开创性地将患者作为独立节点纳入异质图,通过GAT实现突变与PPI信息的协同传递。其核心突破在于:1)BM25-tf-rf特征量化突变对特定癌症的指向性;2)定向边设计强化蛋白质对患者节点的信息更新;3)解释器模块为机制研究提供新靶点。相较于现有技术,GNNMutation将癌症分类性能提升25%以上,且无需肿瘤组织样本,仅需血液检测数据即可实现无创诊断。研究不仅为癌症早筛提供新工具,其异质图建模思路更为其他复杂疾病的多组学整合研究树立了范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号