整合多组学数据揭示癌症染色体臂缺失驱动基因的新框架
《Cell Reports》:Integrating mutation, copy number, and gene expression data to identify driver genes of recurrent chromosome-arm losses
【字体:
大
中
小
】
时间:2025年10月25日
来源:Cell Reports 6.9
编辑推荐:
本研究针对癌症中染色体臂缺失的驱动基因鉴定难题,开发了整合突变、拷贝数和基因表达数据的多组学分析框架。通过对20种癌症类型的7500个TCGA样本进行分析,研究团队成功识别出322个候选驱动基因,发现大多数驱动基因具有癌症类型特异性,同时揭示了关键通路改变与染色体臂缺失的关联。该研究为理解非整倍体在癌症中的作用机制提供了重要资源。
癌症研究领域长期面临一个核心难题:虽然90%的实体肿瘤都存在非整倍体现象,但导致特定染色体臂反复缺失的真正驱动基因却大多未知。非整倍体作为癌症的标志性特征,其形成机制和功能影响一直是科学家们关注的焦点。每个染色体臂缺失事件会影响数百甚至数千个基因,如何在众多基因中精准识别出真正的"司机"基因,成为领域内的重大挑战。
以往的研究主要关注染色体臂的整体特征与缺失频率的关系,例如肿瘤抑制基因的密度和效力。然而,这些研究未能直接鉴定具体的驱动基因。随着癌症基因组图谱等大型数据库的建立,以及高通量测序技术的成熟,研究人员现在有机会从多组学角度深入探索这一难题。
在这项发表于《Cell Reports》的研究中,研究团队提出了一个创新的分析框架,通过整合突变、拷贝数变异和基因表达三种数据类型,系统性地识别与癌症类型特异性染色体臂缺失相关的驱动基因。研究团队分析了20种癌症类型的约7500个TCGA样本,首先确定了230个在特定癌症类型中复发缺失的染色体臂-癌症类型对。
研究采用的关键技术方法包括:利用GISTIC2.0识别共现性局灶缺失,应用MutSig2CV分析共现性点突变,通过PRODIGY算法筛选互斥性局灶缺失的驱动基因,结合逆概率处理加权控制混杂因素进行差异表达分析,以及使用基因集富集分析鉴定通路水平改变。样本主要来源于TCGA数据库,验证分析使用了METABRIC乳腺癌数据集。
研究团队建立了系统性的分析流程,首先计算每个染色体臂在20种癌症类型中的缺失频率,将缺失频率超过20%的臂定义为复发缺失事件。针对每个复发缺失事件,分别进行遗传学分析和表达分析,最终整合结果识别候选驱动基因。
Focal deletions co-occurring with chromosome-arm losses
研究发现与臂缺失共现的局灶缺失通常较小,中位大小约为1.1Mb,涵盖中位11个基因。这一模式表明存在通过双重缺失实现双等位基因失活的驱动基因。在BRCA等癌症类型中,研究人员发现共缺失区域往往只包含少数基因,如10q染色体上的PTEN基因,其在多发性癌症类型中都被识别为驱动基因。
Point mutations co-occurring with arm losses
通过分析臂缺失背景下频繁发生的点突变,研究团队识别出另一类驱动基因。这些基因通过臂缺失和点突变的组合实现双等位基因失活。TP53是这一模式的典型代表,在14种癌症类型中都被鉴定为17p缺失的驱动基因。
Focal deletions mutually exclusive with chromosome-arm losses
研究还发现了一类与臂缺失相互排斥的局灶缺失事件,这些缺失区域较大,中位长度为6.9Mb,涵盖中位159个基因。这种模式表明这些区域包含的驱动基因可能通过单一事件即可发挥功能,或者附近存在必需基因阻止了双等位缺失。
Gene expression changes associated with recurrent chromosome-arm losses
表达分析显示,臂缺失与显著的转录组改变相关。通过比较携带特定臂缺失的肿瘤与不携带缺失的肿瘤,研究人员发现平均有19个Hallmark基因集出现差异表达。然而,这些表达改变在不同癌症类型间并不完全一致,表明其受到背景特异性的影响。
Integrating the genetic analyses with the gene expression analyses
整合分析发现,候选驱动基因显著富集于臂缺失相关的失调通路中。例如,TP53出现在细胞周期检查点和程序性细胞死亡通路的leading-edge子集中,进一步支持了其作为17p缺失驱动基因的生物学合理性。
研究结论表明,大多数候选驱动基因具有癌症类型特异性,强调了非整倍体功能的背景依赖性。同时,研究团队开发了基于候选驱动基因的Charm评分系统,该评分与臂缺失频率的相关性优于先前基于所有肿瘤抑制基因的评分系统,证明了所识别驱动基因的生物学意义。
这项研究的重要意义在于首次系统性地鉴定了染色体臂缺失的驱动基因,为理解非整倍体在癌症发生发展中的作用提供了新的视角。研究建立的整合分析框架和提供的候选基因资源,将推动后续实验验证和机制研究,最终有助于开发针对特定非整倍体的靶向治疗策略。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号