子宫内膜样癌分子全景:多组学整合与深度学习驱动的个性化生存预测新范式

【字体: 时间:2025年05月07日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  本研究针对子宫内膜样癌(EEA)预后评估的临床局限性,创新性地开发了融合转录组、甲基化和蛋白质组的多组学深度学习分析流程。团队设计新型自编码器(autoencoder)及专属损失函数,从TCGA-UCEC数据中挖掘出346个生存相关特征,首次揭示维生素D受体与甘丙肽受体通路在EEA生存中的关键作用,为精准医疗提供新型生物标志物。该研究突破传统Cox模型的线性限制,通过预训练策略解决高维数据过拟合问题,显著提升对删失数据的生存信息提取能力。

  

子宫内膜癌作为女性第六大高发癌症,其子宫内膜样亚型(EEA)占病例总数的80%,但临床上面临着严峻的预后评估困境。传统基于临床分期和病理特征的预测方法存在明显局限性,而既往研究多局限于单一组学数据或线性分析模型,难以捕捉疾病进展的复杂生物学机制。更棘手的是,现有方法对临床常见的删失数据(censored data)信息利用率不足,且高维组学数据与生存结局间的非线性关联长期未被充分挖掘。

为解决这些关键问题,来自中国的研究团队在《Computers in Biology and Medicine》发表创新性研究,通过整合TCGA数据库中EEA患者的转录组、甲基化和蛋白质组数据,开发了新型深度学习生存分析框架。研究核心是设计具有特殊损失函数的自编码器,该模型先在泛癌种数据上预训练后微调,有效克服了特征维度远超样本量的技术挑战。通过SHAP值排序和通路富集分析,最终锁定346个生存相关特征,其中维生素D-VDR(维生素D受体)信号与甘丙肽受体(Galanin receptor)通路的关联性发现尤为瞩目。

关键技术包括:1) 构建融合Cox风险损失的新型自编码器架构;2) 采用TCGA全癌种数据预训练防止过拟合;3) 应用SHAP算法量化特征重要性;4) 基于KEGG和GO数据库进行通路富集分析。研究队列来自TCGA-UCEC项目中EEA患者的multiomics数据。

【Materials and methods】
研究团队建立深度学习框架处理多组学数据,自编码器瓶颈层专门设计用于捕捉生存相关非线性特征。创新性损失函数整合传统重构误差与生存信息提取目标,通过预训练-微调两阶段策略优化模型。

【Results】
自编码器成功将高维数据压缩至30维潜在空间,SHAP分析筛选出346个关键特征。聚类显示嵌入空间能有效区分不同生存风险群体。通路分析揭示VDR信号通路与细胞周期调控、Galanin受体与神经内分泌调节的显著关联,其中m7G甲基化修饰相关基因呈现特殊表达模式。

【Discussion】
相比传统Cox回归,该框架突破性地实现了:1) 多组学数据的非线性关系建模;2) 删失数据信息的高效利用;3) 跨癌种知识迁移的预训练策略。发现的VDR通路与既往报道的子宫内膜癌激素调控机制相印证,而Galanin受体的新关联为肿瘤微环境研究提供新方向。

【Conclusion】
该研究创立了首个整合深度学习的EEA多组学生存分析框架,其创新性体现在:1) 专为生存分析设计的自编码器架构;2) 兼顾数据重构与生存预测的复合损失函数;3) 跨癌种迁移学习策略。不仅提供可推广至其他癌种的分析范式,更发现VDR-RXR异源二聚体可能作为EEA预后评估的新靶点。研究由Behnaz Haji Molla Hoseyni等学者完成,所有数据均来自公开TCGA数据库。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号