
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:解码癌症基因组重排:发现新型驱动因子的路径
【字体: 大 中 小 】 时间:2025年09月01日 来源:Molecules and Cells 6.5
编辑推荐:
这篇综述系统阐述了癌症中体细胞基因组重排(SV)的分子机制与临床价值,重点分析了非经典重排(如基因间区融合)产生的功能性转录本及其作为治疗靶点的潜力。文章整合了全基因组测序(WGS)和转录组数据的最新进展,探讨了重复序列、GC含量、复制时序等基因组特征对重排形成的影响,并评述了基于机器学习的热点检测模型(如FishHook、SVSig-2D)。
基因组重排是约25%癌症患者的驱动事件,目前已有12类重排被FDA批准为靶点(如ALK、ROS1),涉及29种靶向药物。激酶基因(如FGFR3-TACC3)的融合常保留激酶域,而FGFR2外显子18缺失则是独立于融合伴侣的致癌关键。值得注意的是,RARA的PML-RARA融合对维甲酸敏感,但罕见融合(如PLZF-RARA)可能耐药,凸显功能异质性。
62%的癌症重排涉及基因间区断点,其中16%的肺癌激酶融合属于此类。这些重排可通过三种机制产生功能性转录本:
经典剪接:如TMPRSS2-ERG通过跳过基因间序列形成框内融合;
伪外显子插入:如ALK融合中基因间序列被剪接为伪外显子,保留激酶活性并对克唑替尼敏感;
增强子劫持:如IGF2BP3因上游THADA重排而过表达。
重复元件(LINE-1/Alu)通过非等位同源重组(NAHR)促进重排,而高GC区易形成G四链体导致复制叉停滞。晚期复制区(如异染色质)依赖易错的NHEJ/MMEJ修复,常见缺失变异;脆弱位点(CFS)则因复制-转录冲突加剧基因组不稳定性。
当前算法分三类:
计数模型(如FishHook):基于Gamma-Poisson回归量化断点密度;
邻近模型(CSVDriver):通过平滑曲线检测局部聚类;
并置模型(SVSig-2D):整合双断裂连接(DBJ)和断裂入侵(BI)概率。深度学习(如Transformer)有望解决组织特异性特征建模的瓶颈。
长读长测序将揭示更多非经典转录本,而多组学整合需突破现有机器学习对细胞类型特异性特征的依赖。变异自编码器(VAE)等新兴算法或可提升驱动重排的检测灵敏度,推动精准肿瘤学发展。
生物通微信公众号
知名企业招聘