
-
生物通官微
陪你抓住生命科技
跳动的脉搏
scTail:基于单细胞3'端RNA测序数据的精准多聚腺苷酸化位点检测与选择性使用分析
【字体: 大 中 小 】 时间:2025年08月08日 来源:Genome Biology 9.4
编辑推荐:
本研究针对单细胞RNA测序(scRNA-seq)中多聚腺苷酸化位点(PAS)检测精度不足的问题,开发了scTail算法。该工具通过利用传统方法忽略的reads 1 cDNA序列,结合深度学习分类器,实现了单核苷酸级精度的PAS检测,并整合BRIE2模型分析选择性多聚腺苷酸化(APA)的细胞类型特异性。研究在肠道分化、食管鳞癌(ESCC)和小鼠前肢发育等模型中揭示了APA调控的新机制,为单细胞转录组分析提供了全新维度。
在生命科学领域,RNA的3'端加工过程如同基因表达的"分子签名",其中多聚腺苷酸化位点(PAS)的选择性使用(APA)能显著影响mRNA稳定性、定位和翻译效率。尽管高通量测序技术已发展十余年,单细胞水平的PAS检测仍面临重大挑战——主流单细胞3'端测序平台(如10x Genomics)产生的数据中,含有精确PAS信息的reads 1 cDNA常被截断或丢弃,而依赖reads 2的分析方法因片段化问题难以精确定位PAS。这种技术局限导致单细胞转录组研究缺失了关键的APA调控维度,无法揭示发育和疾病中细胞状态转换的精细调控机制。
香港大学医学院生物医学科学学院的研究团队在《Genome Biology》发表的研究突破了这一技术瓶颈。研究人员开发了scTail算法,创新性地利用reads 1中保留的cDNA序列直接捕获PAS信号,结合卷积神经网络(CNN)过滤假阳性位点,并通过概率模型整合reads 2数据进行定量分析。关键技术包括:基于paraclu的PAS聚类算法、预训练的序列特异性CNN分类器(人类和小鼠模型AUROC分别达0.975和0.968)、以及基于片段大小分布的UMI计数分配模型。研究分析了来自10x Genomics平台的多个数据集,包括14,537个人肠道上皮细胞、89,313个食管鳞癌细胞和70,376个小鼠胚胎前肢细胞。
设计scTail整合双链读段进行PAS分析
通过比较reads 1与reads 2到注释PAS的距离分布,发现reads 1末端更紧密聚集在PAS周围(中位距离-11bp vs -132bp)。在K562细胞系测试中,scTail检测到的73.6% PAS与已知注释一致,26.2%为新发现位点,主要分布在3'UTR(63.2%)、内含子(25.4%)和外显子(10.9%)区域。
scTail实现精准灵敏的PAS识别
与Sierra、MAAPER等方法相比,scTail在K562数据集上展现最高精确度(QuantSeq REV验证),尤其在细胞覆盖度>2000时F1-score显著优于其他方法。序列motif分析显示,scTail检测的PAS上游25-35bp存在典型AAUAAA信号,下游富含GU/U/G序列,与已知PAS特征完全吻合。
scTail助力细胞身份与分化轨迹解析
在人类肠道细胞分析中,基于14,025个PAS的聚类显示细胞类型而非组织来源决定PAS使用模式。关键标记基因如SULT1A2(肠细胞)、REP15(杯状细胞)的PAS特征具有特异性。伪时间分析发现,与基因表达相比,PAS谱能更清晰区分祖细胞与分化细胞(如杯状细胞和潘氏样细胞),提示APA重塑是干细胞特性丢失的关键调控层。
食管鳞癌微环境中PAS使用的改变
ESCC肿瘤微环境分析发现1,005个基因存在肿瘤特异性APA切换,整体呈现3'UTR缩短趋势(如S100A14、PITX1)。IL1RN基因在成纤维细胞和肥大细胞中展现相反的APA转换模式。RBP表达分析揭示PABPC1下调与3'UTR缩短相关,随机森林模型鉴定出ECM1(R=0.686)等基因的PSI值可被RBP表达精准预测。
小鼠前肢发育中的多聚腺苷酸化位点转换
胚胎发育时序分析发现肌细胞中Tpm2从E12.0开始由远端PAS转向近端使用,而间充质细胞Pim1呈现相反转换模式。功能富集显示E10.5时期肌细胞的APA转换基因显著富集于RNA代谢和蛋白质分解过程,CPSF7表达随发育阶段逐步升高,与早期胚胎UTR长度调控机制一致。
这项研究建立了首个能同时实现单细胞水平PAS精准检测与定量分析的计算框架,其创新性体现在三方面:技术层面突破reads 1信息利用瓶颈,开发出比现有方法精确度提升30%的算法;生物学层面首次系统揭示APA在细胞命运决定、肿瘤微环境塑造和胚胎发育中的动态调控图谱;方法论层面实现与Scanpy生态无缝对接,推动单细胞多组学整合分析。特别是发现PABPC1等RBP通过调控APA影响ESCC进展,为癌症治疗提供了新靶点。该成果将促进mRNA疫苗3'UTR优化设计,并为遗传变异如何通过APA影响疾病易感性提供研究范式。
生物通微信公众号
知名企业招聘