基于RNA变异等位基因频率的癌症驱动基因发现新工具RVdriver的开发与应用

【字体: 时间:2025年06月14日 来源:Genome Biology 10.1

编辑推荐:

  本研究针对传统癌症基因识别方法过度依赖DNA数据的局限性,开发了多组学工具RVdriver。通过分析7882例配对肿瘤样本的RNA变异等位频率(RNA VAF),首次系统揭示了突变表达模式在区分癌症基因中的关键作用,不仅验证了已知癌症基因如TP53的功能特征,还发现了ERBB3、SMARCA1等新型候选驱动基因。该研究为癌症基因组学提供了转录组层面的创新分析维度,相关成果发表于《Genome Biology》。

癌症驱动基因的鉴定一直是肿瘤研究的核心课题。传统方法主要基于DNA测序数据,通过突变频率、功能影响等特征识别驱动基因,但这类方法往往忽略了转录组层面蕴含的重要生物学信息。随着TCGA等大型项目积累了大量配对DNA-RNA测序数据,如何整合多组学信息成为突破现有研究瓶颈的关键。

英国伦敦大学学院癌症研究所等机构的研究团队开发了创新算法RVdriver,通过量化RNA变异等位频率(RNA VAF)的系统性偏移来识别癌症基因。该研究首次在31种癌症类型的7882例样本中证实:与非癌症基因相比,癌症基因中的非同义突变表现出显著更高的RNA VAF值,这种差异在肿瘤抑制基因中尤为明显。研究不仅验证了TP53等经典癌症基因的功能特征,还发现了ERBB3在乳腺癌中、SMARCA1在肾癌中等15个未被DNA方法检测到的X染色体相关驱动基因。更值得注意的是,RNA VAF能有效区分肿瘤抑制基因中的功能性突变(AUC=0.71),为临床突变注释提供了新维度。相关成果为多组学整合研究树立了新范式。

关键技术方法包括:1) 基于TCGA和TRACERx队列的7882例配对WES-RNAseq数据;2) 开发RNA VAF计算模型,整合无义介导的mRNA降解(NMD)校正和等位基因特异性表达(ASE)分析;3) 采用加权线性模型和25次bootstrap检验评估基因显著性;4) 通过COSMIC癌症基因普查(CGC)和gnomAD数据库进行功能验证;5) 使用BoostDM驱动突变预测进行性能 benchmarking。

Mutation expression in solid tumors
分析发现39%的体细胞突变在RNA层面表达,其中COSMIC癌症基因中的同义突变表达率显著低于错义突变(p<2.2e-16),提示突变表达模式可反映基因功能重要性。

RNA VAF differentiates cancer genes
在结直肠癌中,癌症基因(如KRAS、TP53)的RNA VAF中位数达0.48,显著高于非癌症基因(0.31)。这种差异在DNA VAF中效应量仅为0.08,而在RNA VAF中提升至0.16,证明转录组数据更具鉴别力。

Performance of RVdriver
与6种DNA方法相比,RVdriver在保持相似灵敏度(检出186个CGC基因)的同时,独特性检出23个CGC基因和33个新型候选基因,如头颈癌中的HUWE1(E3泛素连接酶)。

RNA VAF predicts driver mutations
在肿瘤抑制基因中,BoostDM预测的驱动突变RNA VAF显著高于乘客突变(p<0.0001),其中EGFR信号通路活性在RNA VAF>0.9的突变组升高2.3倍,证实其功能预测价值。

该研究开创性地建立了RNA VAF与癌症基因功能的关联框架,揭示转录组数据能捕捉DNA方法遗漏的选择压力信号。特别在X染色体基因和表观调控因子(如KDM6B)的发现上展现出独特优势。RVdriver作为开源工具,其提出的"突变表达偏移"概念为理解癌症进化提供了新视角,未来可结合单细胞测序进一步解析肿瘤异质性。研究同时提示PIK3CA等基因可能存在RNA表达抑制机制,这些发现对精准医疗的靶点筛选具有重要指导意义。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号