机器学习揭示癌症相关基因在原发和转移性肿瘤中的转录模式及其治疗靶点意义

【字体: 时间:2025年08月08日 来源:BMC Biology 4.5

编辑推荐:

  本研究通过机器学习方法分析TCGA和POG队列中9334例肿瘤样本的转录组数据,探索50个癌症驱动基因突变对转录模式的影响。研究人员采用随机森林模型(RF)鉴定了TP53、CDKN2A等基因的泛癌转录特征,以及ATRX、BRAF等基因的肿瘤类型特异性表达模式,发现DRG2与ATRX突变显著相关,AURKA抑制剂可能对FBXW7或NSD1突变肿瘤具有治疗潜力。该研究为癌症精准治疗提供了新靶点,发表于《BMC Biology》。

  

癌症治疗面临的关键挑战在于理解基因组变异如何通过转录重编程驱动肿瘤进展。尽管DNA测序已广泛应用于临床,但仅部分患者携带可操作突变,且单纯基因组分析难以预测治疗响应。这种局限性促使科学家探索转录组动态如何反映癌症的分子机制,并为开发靶向疗法提供新思路。

加拿大不列颠哥伦比亚省癌症研究所(Canada's Michael Smith Genome Sciences Centre at BC Cancer)的Faeze Keshavarz-Rahaghi等研究人员,通过整合TCGA和POG项目中9334例肿瘤的全转录组数据,利用机器学习解析了50个关键癌症基因突变对应的转录特征。研究发现发表于《BMC Biology》,揭示了从泛癌模式到肿瘤类型特异性表达的多层次调控网络,并鉴定出AURKA抑制剂等潜在治疗策略。

研究团队采用随机森林(RF)模型对包含SNV/INDEL(单核苷酸变异/插入缺失)、拷贝数变异(CNA)的多组学数据进行分类,通过五折交叉验证评估性能。针对样本不平衡问题,采用肿瘤类型特异性分析和下采样策略优化模型。通过SHAP分析解读特征重要性,并结合DepMap细胞系数据验证关键发现。

结果

随机森林分类结合多组学数据提升性能

整合CNA数据使模型F1评分平均提高19.3%,而结构变异(SV)影响微弱。TP53分类中RF模型显著优于SVM(支持向量机)和神经网络,F1达0.87。

肿瘤类型特异性模式与泛癌特征并存

ATRX在低级别胶质瘤(LGG)中呈现最强转录特征,DRG2表达与ATRX突变显著相关(p=6.79×10-48),且相关性高于IDH1突变。泛癌分析中,RB1突变导致AURKA过表达(p=3.40×10-282),与临床前研究提示的靶向性一致。

关键通路与治疗靶点发现

PTEN突变样本中CDCA8、CDC20等细胞周期基因激活,SHAP分析显示AURKA在FBXW7/NSD1突变肿瘤中起核心作用。非经典突变如RB1内含子变异(c.1695+24,161G>T)通过影响剪接被模型识别。

讨论

该研究通过机器学习建立了癌症基因突变与转录重编程的映射关系,其重要意义在于:

  1. 机制层面:揭示ATRX-DRG2轴调控G2/M检查点、AURKA在RB1缺陷肿瘤中的合成致死效应等新机制;

  2. 临床转化:提出DRG2恢复策略用于ATRX突变型胶质瘤,以及AURKA抑制剂用于PTEN/FBXW7突变患者的精准治疗路径;

  3. 技术革新:证明RF模型可识别非编码区变异的生物学影响,如EZH2(c.-8+9249A>T)对RNA加工的干扰。

研究局限性包括肿瘤纯度、克隆异质性对转录信号的干扰,未来需结合单细胞测序和蛋白质组学进一步验证。随着NIH"癌症登月计划"等大样本项目的推进,此类分析将更广泛应用于临床生物标志物发现。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号