基于IsoDiffR的长读长单细胞RNA测序技术解析细胞类型特异性异构体表达新机制

《Bioinformatics》:Analyzing cell-type-specific isoform expression using IsoDiffR and long-read single-cell RNA sequencing

【字体: 时间:2025年12月17日 来源:Bioinformatics 5.4

编辑推荐:

  本研究针对长读长单细胞RNA测序(scRNA-seq)技术缺乏专用分析工具的瓶颈,开发了创新软件IsoDiffR。该工具通过整合调整后R平方(adj. R2)和余弦相似性分析,能够精准识别跨细胞类型表达模式不同于对应基因或主要异构体的RNA异构体(DEIs)。在食蟹猴角膜缘和人类前额叶皮层数据中的应用,成功揭示了传统方法无法检测到的细胞类型特异性异构体,并通过AlphaFold3预测发现这些异构体具有独特的蛋白结构和功能特征,为单细胞水平基因表达调控研究提供了重要方法学突破。

  
随着单细胞RNA测序(scRNA-seq)技术的飞速发展,科学家们得以在单个细胞水平解析基因表达的异质性。然而,传统的短读长测序技术只能提供基因水平的表达信息,无法全面揭示RNA异构体(即同一基因通过可变剪接产生的不同转录本)的表达模式。近年来兴起的long-read scRNA-seq技术虽然能够获得全长转录本信息,但专门针对该技术的分析工具却十分匮乏,这严重限制了科研人员对细胞类型特异性异构体功能的深入探索。
目前常用的分析方法如percent-spliced in (PSI)主要关注单个外显子的剪接事件,而IsoformSwitchAnalyzeR等工具虽能分析异构体转换,却难以应用于单细胞数据。更重要的是,现有方法无法有效区分观测到的异构体特异性表达究竟源于基因水平的差异表达,还是真正的异构体特异性调控机制。这一技术瓶颈阻碍了科研人员从异构体层面理解基因表达调控的复杂性。
针对这一挑战,研究人员在《Bioinformatics》发表了创新性研究成果。他们开发了专门用于分析单细胞RNA异构体表达数据的软件包IsoDiffR,该工具能够处理单细胞RNA异构体表达矩阵,识别跨细胞类型的差异表达异构体(Differentially Expressed Isoforms, DEIs),支持两两比较和多细胞类型比较。通过整合adj. R2和余弦相似性分析,并结合异构体与基因表达比例差异的评估,IsoDiffR为检测异构体水平表达变异提供了稳健框架。
关键技术方法
研究团队首先利用scISA-Tools处理来自食蟹猴角膜缘和人类前额叶皮层的long-read scRNA-seq数据,生成基因和异构体水平的计数矩阵。使用Seurat进行细胞聚类和标记物识别后,通过自主开发的IsoDiffR包进行DEIs检测,该工具采用线性回归模型评估异构体表达与基因/主要异构体的偏离程度。功能分析采用clusterProfiler进行GO和KEGG富集分析,蛋白结构通过AlphaFold3预测,相互作用网络通过STRING数据库构建。
3.1 方法学概述与实验设计
研究团队建立了完整的分析流程:从long-read scRNA-seq数据获取开始,经过IsoDiffR的数据准备、DEIs识别和表达可视化三个主要步骤,最后进行功能分析和蛋白预测。IsoDiffR通过设置最小表达比例(min.pct)阈值过滤低表达异构体,并要求每个异构体对其父基因表达的贡献大于10%,确保分析可靠性。
3.2 模拟数据验证IsoDiffR准确性
在模拟的bulk和单细胞RNA-seq数据集上的基准测试表明,IsoDiffR在不同测序深度(0.5M/1M/2M reads)和细胞数量(100/300/1000)条件下均保持高精度和高召回率,显著优于IsoformSwitchAnalyzeR和IsoSwitch。特别是在单细胞数据中,IsoDiffR表现出卓越的稳定性,而IsoSwitch的性能接近随机水平。
3.3 伪bulk数据集评估
在食蟹猴角膜缘数据中,IsoDiffR识别出114个DEIs,与IsoformSwitchAnalyzeR检测到的82个转换异构体仅有26个重叠。进一步分析发现,IsoformSwitchAnalyzeR特异性识别的异构体与对应基因表达高度一致,而IsoDiffR特异性识别的DEIs则表现出明显的表达模式偏离,证明IsoDiffR能更敏感地检测异构体水平差异表达。
3.4 真实long-read scRNA-seq数据分析
在食蟹猴角膜缘数据中,IsoDiffR鉴定出107个相对于基因的DEIs和80个相对于主要异构体的DEIs。功能富集分析显示这些DEIs显著富集于Wnt信号通路,其中KLF4基因的一个DEIs在角膜上皮细胞中特异性下调。结构分析发现该DEIs具有独特的结构域组成,AlphaFold3预测显示其与转录共激活因子EP300和CREBBP存在特异性相互作用。
在人类前额叶皮层数据中,通过调整min.pct阈值至0.1以适应数据稀疏性,鉴定出114个相对于基因的DEIs和40个相对于主要异构体的DEIs。这些DEIs显著富集于"胰岛素响应"通路,与阿尔茨海默病病理相关。其中VPS13C基因的一个DEIs在少突胶质细胞和小胶质细胞中特异性沉默,而在神经元中高表达。结构预测显示该DEIs包含独特的Chorein_N结构域,可能参与脂质转运功能。
结论与展望
IsoDiffR填补了long-read scRNA-seq数据异构体水平分析的工具空白,通过创新的算法框架实现了对细胞类型特异性异构体的精准识别。研究不仅提供了强大的分析方法,还通过多组学整合揭示了DEIs的生物学功能,为理解单细胞水平转录组复杂性提供了新视角。该方法的应用将推动异构体功能研究从基因水平向更精细的转录本水平迈进,为疾病机制研究和治疗靶点发现提供新的突破口。未来随着long-read测序技术的普及,IsoDiffR有望成为异构体水平单细胞分析的标准工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号