融合外显子-外显子连接区读段技术显著提升差异剪接检测效能

【字体: 时间:2025年07月25日 来源:BMC Bioinformatics 2.9

编辑推荐:

  本研究针对RNA测序(RNA-seq)中传统差异外显子使用(DEU)分析忽略外显子连接区读段导致统计效能降低的问题,开发了差异外显子-连接区使用(DEJU)分析流程。通过整合STAR比对、Rsubread定量及edgeR/limma统计框架,在模拟数据和小鼠乳腺上皮细胞数据中证实DEJU能有效控制假发现率(FDR<0.05),对可变剪接位点(ASS)和内含子保留(IR)事件的检测灵敏度提升30%,为癌症等疾病中异常剪接研究提供了更精准的工具。

  

在真核生物中,单个基因通过选择性剪接(Alternative splicing, AS)可产生多个转录本,这种机制贡献了超过90%的人类基因多样性。然而,异常的剪接调控与癌症等疾病密切相关——例如乳腺癌中FGFR1基因的异常剪接会导致细胞分化紊乱。目前,基于RNA测序(RNA-seq)的差异外显子使用(Differential exon usage, DEU)分析是研究剪接变异的金标准,但传统方法存在明显局限:当读段跨越两个外显子时会被重复计数,且无法检测涉及剪接位点变异的细微剪接事件。

澳大利亚Walter and Eliza Hall医学研究所(The Walter and Eliza Hall Institute of Medical Research)的Mai T.Pham团队在《BMC Bioinformatics》发表研究,开发了差异外显子-连接区使用(Differential exon-junction usage, DEJU)分析流程。该工作通过创新性地整合外显子-外显子连接区读段信息,解决了传统方法的双重计数问题,使剪接变异检测灵敏度平均提升27%,特别是在识别可变剪接位点(Alternative 3'/5' splice site, ASS)和内含子保留(Intron retention, IR)事件方面表现突出。

关键技术包括:1)采用STAR双通道比对策略提高新型连接区识别率;2)通过Rsubread的featureCounts功能分别量化外显子和连接区读段;3)基于edgeR/limma框架开发diffSpliceDGE/diffSplice函数进行统计检验;4)使用小鼠乳腺上皮细胞(Luminal progenitor vs Mature luminal)数据集验证生物学意义。

结果
假发现率与统计效能
在模拟数据中,DEJU-edgeR对四种剪接模式(外显子跳跃ES、互斥外显子MXE、ASS、IR)的FDR控制在0.022-0.045之间,灵敏度达83.9-99.5%。相较之下,传统DEU方法对ASS和IR的检测失败率高达40%(图2)。当样本量增至10个/组时,DEJU对ASS事件的检测功率提升至97.7%。

计算资源
DEJU分析单样本仅需0.47分钟,内存消耗0.64GB,较DEXSeq提速38倍(表2)。这种高效性使其适用于TCGA等大规模癌症队列研究。

小鼠乳腺上皮细胞分析
在LP与ML细胞比较中,DEJU独特性识别出55%的差异剪接基因(图4A),包括调控EGFR信号通路的Mvb12a基因。典型案例如Fgfr1基因的连接区差异使用(调整P=0.018),该信号被传统DEU方法完全遗漏(调整P=1)(图4B)。

结论与讨论
该研究通过创新性整合连接区读段,解决了RNA-seq剪接分析中长期存在的双重计数和技术瓶颈问题。DEJU不仅提升了对已知剪接模式的检测灵敏度,更首次实现了对内含子保留事件的系统筛查。在应用层面,其高效的计算性能(10样本分析<1小时)使其成为大型癌症队列研究的理想工具。研究者特别指出,随着单细胞长读长测序技术的发展,未来有望将该方法拓展至单细胞分辨率,为肿瘤异质性和转移机制研究开辟新途径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号