基于单样本基因集富集分析的生存预后相关基因集大规模排序方法

【字体: 时间:2025年05月29日 来源:Artificial Intelligence in Medicine 6.1

编辑推荐:

  本研究针对基因集富集分析(GSEA)在生存分析中的不足,开发了一种结合单样本GSEA评分与生存差异检验的创新方法。通过TCGA多癌种数据和MSigDB基因集验证,发现干扰素-α响应等关键通路与患者生存显著相关,为分子通路与临床预后关联研究提供了新工具。

  

在精准医疗时代,理解分子通路变化如何影响疾病进展仍是重大挑战。虽然基因集富集分析(GSEA)已成为发现表型标记的金标准,但其在生存分析中的应用却长期受限。传统方法依赖Cox比例风险模型,但该模型存在比例风险假设易被违反的缺陷,且现有研究多局限于单一癌种。更关键的是,缺乏系统评估基因集与生存关联的标准化流程,导致大量潜在生物标志物未被发掘。

为解决这些问题,斯洛文尼亚研究团队在《Artificial Intelligence in Medicine》发表研究,提出基于单样本GSEA(ssGSEA)的生存相关基因集排序框架。该方法通过三个关键步骤:首先过滤低表达基因,接着用ssGSEA计算个体化富集分数,最后通过中位数分割样本并采用对数秩检验和限制性平均生存时间(RMST)评估生存差异。研究分析了19个TCGA数据集中的Hallmark基因集,发现12种癌症存在显著生存差异的基因集,其中干扰素-α(IFN-α)响应在皮肤黑色素瘤中显示最强关联,这与已知的STAT2信号通路抑癌作用高度吻合。

主要技术方法
研究使用TCGA跨癌种转录组数据和MSigDB的Hallmark基因集。关键技术包括:单样本GSEA(ssGSEA)进行个体化评分、中位数分割创建富集/非富集队列、对数秩检验和RMST评估生存差异、Benjamini-Hochberg法校正p值。所有分析均采用R语言实现。

Results结果
在12/19的TCGA数据集中鉴定到显著生存相关基因集。黑色素瘤中IFN-α响应基因集排名首位,其富集队列显示显著生存优势(p<0.001),与文献报道的STAT2通路抑癌机制一致。其他如KRAS信号在胰腺癌、TNF-α在肾癌中的排名均与已知生物学证据相符。

Discussion讨论
该方法突破传统GSEA依赖二元表型的限制,首次实现基因集的生存相关性系统排序。但研究者强调这属于假设生成工具,需结合实验验证。值得注意的是,不同分割方法(三分位vs中位数)会影响结果稳定性,建议采用多方法交叉验证。

Conclusions结论
该研究建立的框架成功将GSEA拓展至生存分析领域,为揭示分子通路与临床预后的关联提供了新范式。通过标准化评分和多重假设检验校正,使得跨癌种比较成为可能,为精准医疗中的预后标志物发现开辟了新途径。未来可结合多组学数据进一步优化模型的预测性能。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号