
-
生物通官微
陪你抓住生命科技
跳动的脉搏
转录本差异使用分析工具在bulk与单细胞RNA测序中的全面性能评估与基准测试研究
【字体: 大 中 小 】 时间:2025年09月12日 来源:NAR Genomics and Bioinformatics 2.8
编辑推荐:
为解决DTU(差异转录本使用)分析工具选择难题,研究人员系统评估了12种工具在bulk与单细胞RNA-seq数据中的性能。研究表明,edgeR、DEXSeq和LimmaDS适用于paired-end数据,DEXSeq和DSGseq适用于single-end数据,satuRn在单细胞数据中优于DTUrtle,Spycone在时间序列分析中表现突出。该研究为转录组学研究中工具选择提供了实证依据。
在高等真核生物中,选择性剪接(Alternative Splicing, AS)是增加蛋白质多样性的重要机制,通过外显子跳跃、可变剪接位点使用等不同剪接方式,使单个基因能够产生多个转录本。当基因在不同条件间发生差异剪接时,即使基因总体表达水平不变,转录本的相对丰度也会发生变化,这种现象被称为差异转录本使用(Differential Transcript Usage, DTU)。DTU可能引发重要的功能后果,例如从编码蛋白的转录本转换为非编码转录本,或在不同功能的转录本之间切换。其中,异构体切换(Isoform Switching, IS)是DTU的一种特殊形式,关注最主要转录本的DTU变化。
尽管DTU在多种疾病中具有重要作用(例如癌症中19%的多转录本基因存在功能性的异构体切换),且与帕金森病等疾病相关,但由于分析工具的多样性和实验条件的复杂性,如何选择最适合的分析工具成为研究人员面临的挑战。以往的研究虽然进行了一些基准测试,但存在诸多局限:例如使用的比对工具已过时、未涵盖单细胞数据分析、未涉及时间序列数据、以及未全面评估新近开发的工具等。此外,随着单细胞RNA测序(scRNA-seq)技术的普及,对单细胞水平DTU分析的需求日益增长,而相关工具的性能尚未得到系统评估。
为解决这些问题,来自德国慕尼黑工业大学、汉堡大学等机构的研究团队在《NAR Genomics and Bioinformatics》上发表了全面评估DTU检测工具性能的研究。他们通过模拟数据和真实转录组数据集,系统比较了12种DTU分析工具在多种实验设置下的表现,包括单端(single-end)与双端(paired-end)测序、不同重复数、不同背景水平以及单细胞和数据时间序列数据。
研究团队采用的主要技术方法包括:利用RSEM模拟生成bulk RNA-seq数据,scDesign3模拟单细胞数据;使用STAR进行剪接感知比对;通过Salmon、kallisto、RSEM和Cufflinks进行转录本定量;应用多种DTU检测工具(如DEXSeq、DRIMSeq、satuRn、LimmaDS等)进行分析;使用精确度、召回率、FDR和F1分数等指标评估工具性能;并通过GO富集分析验证生物学相关性。使用的真实数据集包括前列腺癌数据集(GSE22260)和SARS-CoV-2感染时间序列数据(GSE157490)。
研究结果通过多个维度展开:
在整体性能评估中,研究发现工具的表现受数据类型和实验设置的显著影响。对于双端测序数据,edgeR、DEXSeq和LimmaDS表现最佳,其中LimmaDS在增加重复数时召回率提升最明显(>0.2)。而对于单端数据,DEXSeq和DSGseq是更好的选择。随着背景水平(即基因不发生差异表达的概率)的增加,DSGseq、DTUrtle和iso-KTSP的假发现率(FDR)显著上升,而DEXSeq、LimmaDS和satuRn的FDR受影响较小。在基因水平上,所有工具的精确度和召回率均有所改善,表明工具能准确检测发生DTU的基因,但在识别具体发生DTU的转录本方面仍存在挑战。
在不同场景下的性能分析显示,工具的表现还受到折叠变化(fold change)和转录本数量的影响。折叠变化越大,事件的检测率越高,从而提高了F1分数。转录本数量较多的基因也表现出更高的F1分数。通过将DTU事件分为三种场景(S1、S2和S3),研究发现DEXSeq在S2和S3场景(典型的DTU事件)中召回率最高,而在S1场景(仅一个差异表达转录本,更类似于差异基因表达)中召回率较低。edgeR和DRIMSeq在所有三种DTU事件中均保持较低的FDR。
在前列腺癌真实数据集上的基准测试中,不同工具检测到的DTU基因集合存在较大差异。iso-KTSP检测到的基因数量最多,但模拟数据显示其F1分数较低(0.25),表明可能存在较多的假阳性。而LimmaDS的F1分数较高(0.4),但在该数据集中检测到的基因数量有限。通过GO富集分析,发现所有工具(除DEXSeq外)均富集到钙黏蛋白结合(cadherin binding)这一术语,其中satuRn和LimmaDS共同检测到的8个DTU基因(如PFN1、HSPA8、PARVA、EPCAM)与前列腺癌相关,揭示了DTU分析在癌症研究中的潜在价值。
在单细胞数据分析中,研究比较了专为单细胞数据设计的DTUrtle和satuRn。在平衡数据集(两个细胞类型,细胞数相等)中,satuRn的召回率更高(达0.86),而DTUrtle的精确度更高(接近1)。随着细胞数量的增加,召回率逐渐提高。然而,在更接近真实情况的非平衡数据集(2-7个细胞类型,细胞数随机)中,两种工具的性能均下降。此外,研究还尝试了伪批量(pseudo-bulk)分析策略,即通过聚合单细胞计数形成元细胞(meta-cell)后再应用bulk分析工具。结果显示,在平衡数据中,该方法提高了召回率但降低了精确度;而在非平衡数据中,精确度和召回率均较低(约0.5和0.1),表明伪批量分析并非单细胞DTU分析的理想解决方案。
在时间序列异构体切换分析中,研究团队将表现较好的成对比较工具(DEXSeq、LimmaDS、satuRn)与专门设计的时间序列工具(TSIS和Spycone)应用于SARS-CoV-2感染的时序数据。成对比较工具检测到大量DTU基因(超过3000个),且DEXSeq和LimmaDS的结果高度重叠(1731个基因)。而时间序列工具检测到的基因数量较少,且TSIS和Spycone之间重叠基因仅48个。通过GO富集分析,发现成对比较工具富集到通用细胞功能术语(如钙黏蛋白结合、泛素相关术语),而Spycone独特地富集到MHC蛋白复合物结合和IgA结合等与免疫应答相关的术语,这与SARS-CoV-2感染后早期体液免疫响应机制相符,体现了时间序列分析在捕捉动态生物学过程方面的优势。
研究结论强调,DTU分析工具的选择应基于具体研究需求。对于双端测序数据,推荐使用edgeR、DEXSeq或LimmaDS;对于单端数据,DEXSeq和DSGseq是更好的选择;在单细胞数据中,satuRn在召回率方面优于DTUrtle;而对于时间序列数据,Spycone能更有效地识别具有生物学意义的动态变化。此外,研究还指出当前工具在区分不同DTU场景(特别是S1事件)方面的不足,以及单细胞转录本定量准确性等技术挑战。
讨论部分进一步展望了未来研究方向,包括开发能够区分不同DTU场景的工具、扩展单细胞数据分析以支持多细胞类型比较、以及利用不断发展的长读长测序技术提高转录本检测准确性。该研究为转录组学研究人员提供了工具选择的实践指南,并促进了我们对选择性剪接在基因表达调控中作用的理解。
生物通微信公众号
知名企业招聘