PHLOWER:基于单细胞多模态数据推断复杂多分支细胞分化轨迹的Hodge拉普拉斯分解新方法

《Nature Methods》:PHLOWER leverages single-cell multimodal data to infer complex, multi-branching cell differentiation trajectories

【字体: 时间:2025年10月24日 来源:Nature Methods 32.1

编辑推荐:

  本研究针对单细胞多模态数据中复杂多分支分化轨迹推断的难题,提出了PHLOWER算法。该方法通过利用单纯复形上的Hodge分解谐波分量,首次实现了对包含5-18个分支的复杂分化树的精确重构。在模拟数据和真实肾脏类器官数据中的验证表明,PHLOWER不仅能准确推断分化轨迹,还能识别关键转录因子(如PAX3、RFX4、ZIC2),为优化类器官培养方案提供了重要工具。该研究为理解细胞分化调控机制提供了新的计算方法。

  
在生命科学研究中,理解细胞如何从原始状态分化为特定功能细胞类型是一个核心问题。随着单细胞测序技术的突破,科学家现在能够以前所未有的分辨率观察细胞分化过程。然而,一个长期存在的挑战是如何从单细胞数据中准确重建复杂的分化轨迹——特别是当细胞经历多个分支点时,传统的计算方法往往难以捕捉这种复杂的分支模式。
更复杂的是,现代单细胞多模态测序技术可以同时测量细胞的转录组和开放染色质信息,这为研究基因调控提供了宝贵机会。但现有的轨迹推断方法大多只能处理简单的分支结构(通常3-9个分支),缺乏对更复杂分化模式的解析能力。这一局限性严重制约了我们在器官发育、疾病进展等复杂生物过程中对细胞命运决定机制的深入理解。
针对这一挑战,德国亚琛工业大学等机构的研究团队在《Nature Methods》上发表了题为"PHLOWER leverages single-cell multimodal data to infer complex, multi-branching cell differentiation trajectories"的研究论文。该研究开发了一种名为PHLOWER(分解Hodge拉普拉斯以从细胞分化流中推断轨迹)的新算法,通过利用拓扑数据分析中的Hodge理论,成功解决了复杂多分支细胞分化轨迹的推断问题。
PHLOWER算法的核心技术在于将单细胞数据表示为单纯复形(simplicial complexes)——一种比传统图结构更丰富的数学对象,不仅包含节点(细胞)和边(潜在分化事件),还包含三角形等更高维结构。研究人员通过离散Hodge拉普拉斯算子(Hodge Laplacian)的谱分解,特别是其谐波分量(harmonic components),来识别单纯复形中的"空洞"(holes),这些空洞恰好对应细胞分化轨迹的分支。
具体而言,PHLOWER首先通过图拉普拉斯和随机游走估计细胞的伪时间(pseudotime),识别祖细胞和终末分化细胞。然后通过Delaunay三角剖分连接高伪时间(分化末端)和低伪时间(祖细胞)的细胞,在图中创建对应主要轨迹的"空洞"。Hodge分解的谐波分量提供了边级嵌入(edge-level embeddings),其中每个点代表一个细胞分化事件,以及轨迹嵌入(trajectory embeddings),每个点代表一个细胞分化路径。通过对这些嵌入空间进行聚类分析,PHLOWER能够精确描绘单细胞数据中的主要分化轨迹并重建复杂的分化树。
在方法学验证方面,研究人员主要采用了以下几种关键技术:基于扩散映射(diffusion maps)的图嵌入技术、Delaunay三角剖分构建单纯复形、Hodge拉普拉斯分解算法、随机游走轨迹采样策略,以及基于DBSCAN的轨迹聚类分析。对于肾脏类器官研究,团队使用了10x Genomics多组学测序(RNA+ATAC)技术,并结合Xenium空间转录组平台进行空间验证。人iPS细胞来源的肾脏类器官样本队列包括分化第7、12、19和25天的时间点,并通过siRNA敲低实验对预测的转录因子进行功能验证。
分化树推断性能评估
研究人员通过模拟数据和真实单细胞RNA测序(scRNA-seq)数据集全面评估了PHLOWER的性能。在模拟数据方面,利用扩散限制聚集(DLA)树生成了10个复杂分化树数据集,分支数量从5到18个不等。与PAGA、Monocle3、Slingshot等主流方法相比,PHLOWER在树拓扑结构恢复方面表现最佳,特别是在细胞分配到正确分支和分支点方面优势明显。
对于33个真实scRNA-seq数据集(来自Dynverse基准平台)的分析进一步证实了PHLOWER的优越性。这些数据集包含单根树结构,至少有三个分支,被分为分叉、多分叉和树状结构。在所有评估指标中(包括HIM距离、细胞分配相关性、F1分支和F1里程碑分数),PHLOWER均获得最高平均分。值得注意的是,分析发现某些方法(如Slingshot)在简单树结构中表现较好,而PHLOWER和Monocle3、PAGA则在复杂结构中表现更优。
在胰腺祖细胞和神经发生数据集的具体案例中,PHLOWER成功恢复了所有主要分支,而其他方法则存在漏检或假阳性分支的问题。特别是在包含约18,000个细胞的神经发生数据中,PHLOWER和PAGA成功重现了主要终末分支,而Monocle3则推断出四个不连接的树,未能完整捕捉分化轨迹。
肾脏类器官细胞轨迹推断
研究人员将PHLOWER应用于人iPS细胞来源的肾脏类器官的多模态单细胞数据(13,751个细胞),成功重建了包含九个分支的分化轨迹。该轨迹清晰地按照类器官培养时间排序细胞,并将细胞分为三大类:上皮细胞(包含足细胞和肾小管细胞两个亚分支)、四个基质细胞分支以及肌肉/神经元细胞分支。
通过标记基因表达分析,研究人员验证了各分支的细胞类型特征:TBXT38和KDR39用于中胚层细胞,PODXL40和NPHS240用于足细胞,SLC12A141和PAPPA241用于肾小管上皮细胞,COL1A240和PDGFRB42用于基质细胞,以及神经元和肌肉标记物MAP236、MSX138,40-42、MYL1和MYF6。
关键转录因子鉴定与验证
PHLOWER的一个重要应用是鉴定驱动iPS细胞在肾脏类器官中分化的关键转录因子。通过结合TF活性评分和分支特异性表达模式,研究人员发现了多个已知的肾脏发育调节因子:足细胞中的WT146和MAFB47,肾小管细胞中的HNF1B48和GRHL249。特别值得注意的是,在神经元/肌肉分支中鉴定出了PAX3、RFX4和ZIC2等已知与神经元分化相关的转录因子。
这些神经元相关TF的发现具有重要意义,因为神经元细胞被认为是肾脏类器官中的脱靶细胞类型,可能阻碍肾脏细胞的成熟。为了验证这一预测,研究人员进行了siRNA敲低实验,针对PAX3、RFX4和ZIC2进行联合敲低。结果显示,敲低后神经元细胞显著减少,同时肾小管细胞和足细胞祖细胞比例增加,免疫荧光染色进一步证实了基质细胞标志物vimentin的减少以及足细胞nephrin和肾小管E-cadherin表达的增加。
空间组织分析
通过Xenium空间转录组平台对肾脏类器官进行亚细胞分辨率的空间分析(105,092个细胞),研究人员进一步验证了PHLOWER的预测结果。空间分析不仅确认了多组学分析中发现的细胞类型和TF表达模式,还揭示了细胞分化的空间背景,有助于理解基于细胞邻域和空间生态位的信号事件。
研究团队通过综合分析得出以下重要结论:PHLOWER通过利用Hodge拉普拉斯分解的谐波分量,首次实现了对复杂多分支细胞分化轨迹的准确推断。该方法在模拟数据和真实数据中均表现出色,特别是在处理复杂树结构方面明显优于现有方法。在肾脏类器官中的应用不仅验证了方法的有效性,还揭示了调控脱靶细胞分化的关键转录因子,为优化类器官培养协议提供了直接指导。
PHLOWER的另一个重要优势是能够整合多模态数据,同时分析基因表达和染色质可及性信息,从而提供更全面的基因调控视角。虽然当前版本仅考虑了Hodge分解的谐波分量,但未来通过纳入梯度项和旋度项,有望进一步扩展至更复杂的细胞分化结构(如无环图)的分析。此外,该方法还有潜力应用于三维分子数据(如蛋白质-配体预测或三维空间转录组学),揭示更高阶的几何特征。
这项研究的成功表明,将拓扑数据分析方法应用于单细胞生物学可以突破现有计算方法的局限,为理解复杂生物过程提供新的视角。随着单细胞多模态数据的不断积累,PHLOWER等基于拓扑原理的计算工具有望在发育生物学、疾病机制研究和再生医学等领域发挥越来越重要的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号