GraphVelo:基于图论的多模态单细胞速度推断新方法揭示细胞动态调控机制

【字体: 时间:2025年08月23日 来源:Nature Communications 15.7

编辑推荐:

  研究人员针对RNA速度(RNA velocity)方法在复杂转录动态、低表达基因及非转录组数据中的局限性,开发了GraphVelo算法。该技术通过切线空间投影实现多模态速度推断,成功解析了病毒-宿主互作、细胞周期等动态过程,为单细胞多组学分析提供了定量研究工具。

  

在单细胞组学时代,解析细胞状态动态变化是生命科学的核心挑战。传统RNA速度(RNA velocity)方法通过剪接动力学推断基因表达变化趋势,但其应用受限于基因特性(如无内含子病毒基因)和数据模态(如染色质可及性)。更棘手的是,现有方法在向量场转换时会丢失定量信息,导致对转录爆发(transcription burst)等复杂动力学现象的误判。

针对这些瓶颈,由Yuhao Chen、Yan Zhang等团队在《Nature Communications》发表的研究提出了GraphVelo框架。该方法创新性地将图论与动力系统理论结合,通过k近邻(kNN)图构建细胞状态流形,利用切线空间投影(TSP)技术校正速度向量。研究团队在模拟数据和真实数据集(包括造血分化、HCMV感染等)中验证发现,GraphVelo不仅能准确推断多模态速度,还首次实现了全基因组范围的动力学基因(MacK genes)筛选。

关键技术包括:1)基于dyngen的模拟数据生成;2)切线空间投影算法优化;3)多组学数据整合分析(如SHARE-seq);4)dynamo向量场建模;5)动态时间规整(DTW)评估多模态耦合。实验数据涵盖小鼠红细胞成熟、人类骨髓发育等7个单细胞数据集。

研究结果主要分为四部分:

  1. 1.

    算法验证:在模拟数据中,GraphVelo的余弦相似度达0.92,显著优于传统方法。对转录爆发基因Smim1的校正显示,其速度方向与表达趋势一致性提高3.7倍。

  2. 2.

    全基因组动力学解析:通过MacK评分系统筛选出200个驱动基因,包括红细胞分化关键因子Gata1。Jacobian分析揭示Gata1-Spi1调控轴,与实验报道一致。

  3. 3.

    病毒-宿主互作:在HCMV感染数据中,成功预测UL122基因的负反馈调节(Jacobian值-0.38),并通过虚拟敲除实验验证UL123为关键病毒因子。

  4. 4.

    多组学整合:在毛囊发育数据中,发现50.3%的细胞周期基因呈现转录-染色质解耦现象,其中Wnt3基因受先锋转录因子(Pioneer TF)Lef1和Hoxc13的时序调控。

讨论部分强调,GraphVelo的创新性在于:首次建立多模态速度向量的数学转换理论(基于Whitney嵌入定理);突破性地将病毒RNA纳入速度分析框架;通过剂量效应曲线定量揭示转录因子调控滞后效应(如Hoxc13激活Wnt3的染色质开放早于转录启动12小时)。这些发现为感染免疫、发育生物学研究提供了新范式,其算法已封装为Python包(BSD 3-Clause许可)。

研究也存在局限:UMAP空间定量分析精度不足;对瞬时态细胞的捕获效率有待提高。未来工作将拓展至蛋白质组学和代谢组学整合分析,进一步完善细胞状态动态的全局图谱。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号