
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于RNA变异等位基因频率的癌症驱动基因发现新工具RVdriver的开发与应用
【字体: 大 中 小 】 时间:2025年06月14日 来源:Genome Biology 10.1
编辑推荐:
本研究针对传统癌症基因识别方法过度依赖DNA数据的局限性,开发了多组学工具RVdriver。通过分析7882例配对肿瘤样本的RNA变异等位频率(RNA VAF),首次系统揭示了突变表达模式在区分癌症基因中的关键作用,不仅验证了已知癌症基因如TP53的功能特征,还发现了ERBB3、SMARCA1等新型候选驱动基因。该研究为癌症基因组学提供了转录组层面的创新分析维度,相关成果发表于《Genome Biology》。
癌症驱动基因的鉴定一直是肿瘤研究的核心课题。传统方法主要基于DNA测序数据,通过突变频率、功能影响等特征识别驱动基因,但这类方法往往忽略了转录组层面蕴含的重要生物学信息。随着TCGA等大型项目积累了大量配对DNA-RNA测序数据,如何整合多组学信息成为突破现有研究瓶颈的关键。
英国伦敦大学学院癌症研究所等机构的研究团队开发了创新算法RVdriver,通过量化RNA变异等位频率(RNA VAF)的系统性偏移来识别癌症基因。该研究首次在31种癌症类型的7882例样本中证实:与非癌症基因相比,癌症基因中的非同义突变表现出显著更高的RNA VAF值,这种差异在肿瘤抑制基因中尤为明显。研究不仅验证了TP53等经典癌症基因的功能特征,还发现了ERBB3在乳腺癌中、SMARCA1在肾癌中等15个未被DNA方法检测到的X染色体相关驱动基因。更值得注意的是,RNA VAF能有效区分肿瘤抑制基因中的功能性突变(AUC=0.71),为临床突变注释提供了新维度。相关成果为多组学整合研究树立了新范式。
关键技术方法包括:1) 基于TCGA和TRACERx队列的7882例配对WES-RNAseq数据;2) 开发RNA VAF计算模型,整合无义介导的mRNA降解(NMD)校正和等位基因特异性表达(ASE)分析;3) 采用加权线性模型和25次bootstrap检验评估基因显著性;4) 通过COSMIC癌症基因普查(CGC)和gnomAD数据库进行功能验证;5) 使用BoostDM驱动突变预测进行性能 benchmarking。
Mutation expression in solid tumors
分析发现39%的体细胞突变在RNA层面表达,其中COSMIC癌症基因中的同义突变表达率显著低于错义突变(p<2.2e-16),提示突变表达模式可反映基因功能重要性。
RNA VAF differentiates cancer genes
在结直肠癌中,癌症基因(如KRAS、TP53)的RNA VAF中位数达0.48,显著高于非癌症基因(0.31)。这种差异在DNA VAF中效应量仅为0.08,而在RNA VAF中提升至0.16,证明转录组数据更具鉴别力。
Performance of RVdriver
与6种DNA方法相比,RVdriver在保持相似灵敏度(检出186个CGC基因)的同时,独特性检出23个CGC基因和33个新型候选基因,如头颈癌中的HUWE1(E3泛素连接酶)。
RNA VAF predicts driver mutations
在肿瘤抑制基因中,BoostDM预测的驱动突变RNA VAF显著高于乘客突变(p<0.0001),其中EGFR信号通路活性在RNA VAF>0.9的突变组升高2.3倍,证实其功能预测价值。
该研究开创性地建立了RNA VAF与癌症基因功能的关联框架,揭示转录组数据能捕捉DNA方法遗漏的选择压力信号。特别在X染色体基因和表观调控因子(如KDM6B)的发现上展现出独特优势。RVdriver作为开源工具,其提出的"突变表达偏移"概念为理解癌症进化提供了新视角,未来可结合单细胞测序进一步解析肿瘤异质性。研究同时提示PIK3CA等基因可能存在RNA表达抑制机制,这些发现对精准医疗的靶点筛选具有重要指导意义。