DOLPHIN:基于外显子和剪接位点读数的单细胞转录组学新方法突破基因水平分析局限

【字体: 时间:2025年07月06日 来源:Nature Communications 14.7

编辑推荐:

  本研究针对单细胞RNA测序(scRNA-seq)中基因水平分析方法忽略外显体和剪接位点信息的关键局限,开发了深度学习框架DOLPHIN。该研究通过构建基因特异性外显子图结构,整合外显体水平定量和剪接位点读数,显著提升了细胞聚类、生物标志物发现和选择性剪接(AS)检测的准确性。研究在多种测序平台和生物系统中验证了DOLPHIN的优越性能,为揭示疾病机制和发现治疗靶点提供了新工具。

  

在生命科学研究的前沿领域,单细胞RNA测序(scRNA-seq)技术如同一把精密的分子显微镜,让科学家们得以窥见单个细胞的基因表达图谱。这项技术已经在发育生物学、免疫学和癌症研究等多个领域掀起革命,帮助研究者发现新的细胞类型、解析发育轨迹并揭示疾病相关的细胞状态。然而,现有的分析方法大多停留在基因水平,将每个基因简化为一个单一的数值,这种"粗放式"的处理方式不可避免地丢失了大量隐藏在转录本外显子和剪接位点中的关键信息。

这种信息流失带来了两个主要问题:一方面,细胞状态的表征变得粗糙,许多细微但重要的生物学差异被掩盖;另一方面,选择性剪接(AS)这种在基因调控中扮演关键角色的过程难以被准确捕捉。特别是在10X Genomics等主流单细胞平台上,由于测序覆盖稀疏且偏向转录本末端,传统的分析方法往往力不从心。这就如同用低分辨率相机拍摄精细画作,许多细节纹理都变得模糊不清。

为了突破这一技术瓶颈,来自麦吉尔大学等机构的研究团队在《Nature Communications》上发表了创新性研究成果。他们开发了名为DOLPHIN的深度学习框架,通过整合外显体水平定量和剪接位点读数,实现了单细胞转录组分析从"基因水平"到"外显子水平"的跨越。这项研究不仅显著提升了细胞表征的精度,还开辟了在单细胞尺度研究选择性剪接的新途径,为理解细胞异质性和疾病机制提供了全新视角。

研究团队采用了多项关键技术方法:首先构建基因特异性外显子图结构,将外显子作为节点、剪接位点作为边;然后应用变分图自编码器(VGAE)处理这些图结构;接着通过K近邻(KNN)方法在潜在空间中进行细胞聚合;最后使用Expedition套件中的Outrigger函数计算剪接百分比(PSI)值。研究分析了来自外周血单个核细胞(PBMC)、结肠直肠组织和胰腺导管腺癌(PDAC)等多个单细胞数据集,涵盖了不同测序平台和生物系统。

研究结果部分,DOLPHIN方法概述显示,该方法通过三个关键步骤实现突破:预处理单细胞RNA-seq数据并构建外显子图;通过变分图自编码器学习细胞嵌入;在潜在空间中聚合相似细胞的剪接位点读数。这种创新方法将每个基因表示为图结构,保留了外显子连接信息,为后续分析奠定了坚实基础。

在细胞嵌入增强方面,研究证明DOLPHIN通过整合外显体和剪接位点读数,显著提升了细胞嵌入质量。在PBMC、10X结肠和10X直肠等多个数据集中,DOLPHIN生成的嵌入在聚类准确性上均优于传统基因计数方法。特别是在PBMC数据中,调整兰德指数(ARI)提高了0.11,标准化互信息(NMI)也有显著提升。这些改进在UMAP可视化中表现为更清晰的细胞类型分离,表明DOLPHIN能捕捉到更精细的细胞状态差异。

在癌症相关标志基因检测方面,DOLPHIN展现出独特优势。研究团队将DOLPHIN应用于胰腺导管腺癌数据集,发现该方法能识别出896个外显子水平差异表达基因(EDEGs),这些基因在传统基因水平分析中均未被检测到。这些EDEGs在胰腺癌相关通路和疾病术语中显著富集,包括SMAD4、ERCC1和TGFBR2等已知与PDAC进展和治疗反应相关的基因。通过生存分析进一步验证,这些DOLPHIN特有的EDEGs能有效区分PDAC患者的高风险和低风险组,展现出重要的临床相关性。

选择性剪接检测方面,DOLPHIN通过剪接位点读数聚合显著提升了检测灵敏度。在PBMC数据中,DOLPHIN检测到的外显子跳跃(ES)事件中位数从183增加到1215,互斥外显子(MXE)事件从4增加到22。更重要的是,这些额外检测到的事件与伪批量PSI值相关性更高(Pearson相关系数提高0.06),表明DOLPHIN不仅能发现更多事件,还能保证检测质量。通过Sashimi图可视化特定AS事件,如PTPRC基因中的HsaEX0051104和CD47基因中的HsaEX0013878,研究直观展示了DOLPHIN如何通过增强剪接位点信号来揭示传统方法遗漏的剪接模式。

在生物学相关AS事件发现方面,DOLPHIN成功识别出具有细胞类型特异性的AS事件。例如在PBMC数据中,B细胞特异的AS事件富集于B细胞激活和B细胞受体信号通路;而在结肠数据中,肠上皮细胞的AS事件与线粒体电子运输等关键功能相关。通过Anchor工具对PSI分布进行模态分类,DOLPHIN显著降低了"多模态"(null)事件的比例,提高了AS信号解析的清晰度。基于PSI模态的聚类分析也显示,DOLPHIN能更好地区分细胞类型(ARI提高0.26),证实了其捕捉细胞特异性剪接模式的能力。

方法学比较部DO

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号