
-
生物通官微
陪你抓住生命科技
跳动的脉搏
GraphVelo:基于图论的多模态单细胞速度推断新方法揭示细胞动态调控机制
【字体: 大 中 小 】 时间:2025年08月23日 来源:Nature Communications 15.7
编辑推荐:
研究人员针对RNA速度(RNA velocity)方法在复杂转录动态、低表达基因及非转录组数据中的局限性,开发了GraphVelo算法。该技术通过切线空间投影实现多模态速度推断,成功解析了病毒-宿主互作、细胞周期等动态过程,为单细胞多组学分析提供了定量研究工具。
在单细胞组学时代,解析细胞状态动态变化是生命科学的核心挑战。传统RNA速度(RNA velocity)方法通过剪接动力学推断基因表达变化趋势,但其应用受限于基因特性(如无内含子病毒基因)和数据模态(如染色质可及性)。更棘手的是,现有方法在向量场转换时会丢失定量信息,导致对转录爆发(transcription burst)等复杂动力学现象的误判。
针对这些瓶颈,由Yuhao Chen、Yan Zhang等团队在《Nature Communications》发表的研究提出了GraphVelo框架。该方法创新性地将图论与动力系统理论结合,通过k近邻(kNN)图构建细胞状态流形,利用切线空间投影(TSP)技术校正速度向量。研究团队在模拟数据和真实数据集(包括造血分化、HCMV感染等)中验证发现,GraphVelo不仅能准确推断多模态速度,还首次实现了全基因组范围的动力学基因(MacK genes)筛选。
关键技术包括:1)基于dyngen的模拟数据生成;2)切线空间投影算法优化;3)多组学数据整合分析(如SHARE-seq);4)dynamo向量场建模;5)动态时间规整(DTW)评估多模态耦合。实验数据涵盖小鼠红细胞成熟、人类骨髓发育等7个单细胞数据集。
研究结果主要分为四部分:
算法验证:在模拟数据中,GraphVelo的余弦相似度达0.92,显著优于传统方法。对转录爆发基因Smim1的校正显示,其速度方向与表达趋势一致性提高3.7倍。
全基因组动力学解析:通过MacK评分系统筛选出200个驱动基因,包括红细胞分化关键因子Gata1。Jacobian分析揭示Gata1-Spi1调控轴,与实验报道一致。
病毒-宿主互作:在HCMV感染数据中,成功预测UL122基因的负反馈调节(Jacobian值-0.38),并通过虚拟敲除实验验证UL123为关键病毒因子。
多组学整合:在毛囊发育数据中,发现50.3%的细胞周期基因呈现转录-染色质解耦现象,其中Wnt3基因受先锋转录因子(Pioneer TF)Lef1和Hoxc13的时序调控。
讨论部分强调,GraphVelo的创新性在于:首次建立多模态速度向量的数学转换理论(基于Whitney嵌入定理);突破性地将病毒RNA纳入速度分析框架;通过剂量效应曲线定量揭示转录因子调控滞后效应(如Hoxc13激活Wnt3的染色质开放早于转录启动12小时)。这些发现为感染免疫、发育生物学研究提供了新范式,其算法已封装为Python包(BSD 3-Clause许可)。
研究也存在局限:UMAP空间定量分析精度不足;对瞬时态细胞的捕获效率有待提高。未来工作将拓展至蛋白质组学和代谢组学整合分析,进一步完善细胞状态动态的全局图谱。
生物通微信公众号
知名企业招聘