
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CLADES:基于神经ODE-Gillespie混合模型揭示克隆细胞命运与分化动力学的创新方法
【字体: 大 中 小 】 时间:2025年09月04日 来源:Nature Communications 15.7
编辑推荐:
本研究针对静态条形码LT-scSeq数据中克隆特异性动力学异质性量化难题,开发了CLADES混合框架。通过整合NeuralODE与Gillespie算法,首次实现了克隆水平分化速率的精准估计和谱系拓扑重建,揭示了造血干细胞(HSPCs)转录状态与克隆行为的内在关联,为发育生物学研究提供了可扩展的计算工具。
在发育生物学领域,理解细胞群体动态变化始终是核心挑战。传统单细胞RNA测序(scRNA-seq)虽能捕捉转录组异质性,却无法解析克隆水平的动力学差异。近年来兴起的谱系追踪单细胞测序技术(LT-scSeq)通过DNA条形码标记,为研究细胞分化提供了新视角。然而,现有分析方法面临三大瓶颈:克隆特异性动力学量化不足、小克隆数据分析困难、真实分化速率难以估算。这些限制严重阻碍了我们对造血发育等过程中克隆行为异质性的深入理解。
针对这些挑战,Mingze Gao等研究团队在《Nature Communications》发表了突破性成果。研究团队创新性地结合了两种计算方法:利用神经ODE(NeuralODE)构建连续动力学模型,整合随机模拟算法(Gillespie)进行离散事件模拟。实验数据包含新生成的人脐带血LARRY数据集和公开小鼠造血数据集,通过流式分选获取CD34+造血干细胞/祖细胞(HSPCs),采用静态条形码设计和10X单细胞测序技术。关键技术亮点包括:1) 基于PAGA图的专家知识引导拓扑构建;2) 通过"元克隆"(meta-clone)策略解决小克隆数据问题;3) 开发双模式(恒定/动态)参数估计框架。
【CLADES框架设计】
研究团队提出的CLADES系统包含两大核心模块:模型估计器采用NeuralODE构建克隆特异性ODE方程组,描述细胞状态转移速率;数据生成器通过改进的Gillespie算法模拟分化拓扑。系统创新性地引入三项关键技术:1) 元克隆聚类将相似动力学特征的克隆合并分析;2) 缩放因子校正技术解决条形码丢失问题;3) 泊松负对数似然损失函数增强模型鲁棒性。在合成数据集验证中,恒定模式对简单动力学模式恢复率达92%,动态模式对复杂时变系统保持>80%准确率。
【人脐带血动力学解析】
应用CLADES分析24,885个条形码细胞,成功识别12个具有独特分化行为的元克隆。如图2所示,元克隆7主要产生单核细胞(Monocyte),其源头HSC/MPP1sub亚群增殖速率达2.5/天;而元克隆0则倾向产生肥大细胞(Mast cell)和红系细胞(Erythroid)。通过Gillespie模拟发现,DC谱系产生需要约5次分裂,与实验观察高度一致。特别值得注意的是,加权平均的元克隆动力学与整体系统(BG)高度吻合(Pearson r=0.94),验证了模型可靠性。

【小鼠造血系统验证】
在5859个小鼠克隆数据分析中,CLADES成功识别13个元克隆,其中元克隆1-4展现多能性(产生≥7种终末状态),而元克隆5-8保持原始状态。如图4所示,动态模式与恒定模式性能相当,提示小鼠系统动力学相对稳定。差异基因分析揭示,元克隆1高表达中性粒细胞相关基因(Cd48、Chek1),而元克隆0富集单核细胞标记物(Ccl24、Ccr2),与各自分化倾向完美对应。

【分子机制探索】
研究进一步发现,元克隆特异性行为源于早期转录状态差异。如图5所示,保持原始状态的元克隆5高表达自我更新基因(Tgfbr3、S1pr1),而分化活跃的元克隆0-4则表达谱系决定因子。这种关联性在两组独立数据集中均得到验证,为克隆行为异质性提供了分子解释。
讨论部分强调,CLADES的创新性体现在三个方面:方法学上首次实现克隆水平动力学的定量描述;生物学上揭示HSPCs转录状态与克隆行为的映射关系;技术上建立可扩展的分析框架。局限性包括:1) 仅分析条形码细胞;2) 依赖先验拓扑知识;3) 对时变系统采样要求较高。未来改进方向包括整合转录组数据进行联合推断、拓展至动态条形码系统、应用于癌症进化研究。该研究为发育生物学和再生医学研究提供了强大工具,特别在造血发育、器官形成等涉及克隆竞争的过程中具有广泛应用前景。
生物通微信公众号
知名企业招聘