
-
生物通官微
陪你抓住生命科技
跳动的脉搏
预测癌症复发的突破:AI模型通过多组学整合提高预后准确性
Fundamental Research:MULGONET: An interpretable neural network framework to integrate multi-omics data for cancer recurrence prediction and biomarker discovery.
【字体: 大 中 小 】 时间:2025年04月11日 来源:AAAS
编辑推荐:
这项工作开发了一个新的深度学习框架MULGONET,通过整合多组学数据(如mRNA、DNA甲基化、拷贝数变异)来预测癌症复发和识别关键生物标志物。该模型利用基因本体(go)层次,克服了数据维度和可解释性的挑战,在膀胱癌、胰腺癌和胃癌数据集上取得了较高的准确率。这项创新使临床医生能够确定与癌症复发相关的关键基因和生物学途径,为个性化治疗策略铺平道路。
在分子水平上预测肿瘤复发是一个关键的挑战,特别是对于具有复杂多组学特征的患者。依赖单一生物标志物的传统预后模型不能充分捕捉基因组、表观遗传和转录组驱动因素之间的相互作用。
特别是,多组学整合面临两个关键障碍:依赖经验特征选择限制了跨癌症的适用性,以及解释生物学途径的巨大计算复杂性。为此,由王建新教授和兰伟博士领导的中南大学和广西大学的研究小组在《基础研究》杂志上发表的一项研究中,研究人员提出了一个新的框架,可以精确和可解释地预测复发风险。
“在分析膀胱癌和胃癌等癌症的多组学数据时,传统的机器学习模型难以捕捉途径级的相互作用,”兰解释说。“我们的新框架MULGONET通过两个关键的进步克服了这一限制。”
MULGONET框架
1. 通过构建基于11,000多个基因本体(go)术语的分层网络,MULGONET自动将基因(如Cdk6)与生物过程(如“细胞周期调节”go:0051726)联系起来,从而消除了手动特征选择的需要。这使得该方法能够应用于反式癌,AUPR评分为0.774(膀胱癌)、0.873(胰腺癌)和0.702(胃癌)。
2. 该模型基于注意力的融合机制在标准硬件上处理3D组学数据(基因×组学层× GO项)用时不到2小时,而现有工具需要8小时以上。
“我们的框架不仅可以预测复发,还可以识别驱动途径,”兰说。例如,在胰腺癌中,“G蛋白偶联受体信号通路”(go:0007186)中Wnt5a的高归因评分与早期复发有关。
该团队已经开放了它的框架来加速社区驱动的应用程序。“我们希望MULGONET能够激发对多组学可解释性的新研究,”王补充说。
该研究发表在KeAi的《基础研究》杂志上,通过揭示Rock1在转移中的可行靶点,直接支持了精确肿瘤学。
Fundamental Research:MULGONET: An interpretable neural network framework to integrate multi-omics data for cancer recurrence prediction and biomarker discovery.
生物通微信公众号
知名企业招聘