基于 Transformer 的图表示学习:在生物网络中可解释地识别癌症基因的关键突破
【字体:
大
中
小
】
时间:2025年01月23日
来源:Nature Biomedical Engineering 27.7
编辑推荐:
当前图表示学习在识别癌症基因时存在可解释性和泛化性不足问题。研究人员开展基于 Transformer 的模型研究,利用多组学数据与生物网络拓扑结构预测癌症基因,性能优异且预测出新候选基因,有助于理解基因调控机制和发现新癌症基因。
图表示学习已被用于从生物网络中识别癌症基因。然而,在整合网络分析中,其可解释性和泛化性不足限制了它的应用。在此,研究开发了一种可解释且具有泛化性的基于 Transformer 的模型,该模型通过利用图表示学习,以及将多组学数据与生物相互作用的同构和异构网络拓扑结构相结合,来准确预测癌症基因。该模型能够解释多组学和高阶结构特征各自的重要性,在全癌和特定癌症场景下,对跨生物网络(包括微小 RNA(miRNA)与蛋白质、转录因子与蛋白质以及转录因子与 miRNA 之间的相互作用网络)的癌症基因预测中达到了最先进的性能,并在 8 个全癌数据集中的 4729 个未标记基因中预测出 57 个癌症候选基因(其中包括 3 个其他模型未识别出的基因)。该模型的可解释性和泛化性可能有助于理解基因相关的调控机制,并发现新的癌症基因。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号