综述:利用时空单细胞转录组数据解析细胞命运轨迹
《npj Systems Biology and Applications》:Deciphering cell-fate trajectories using spatiotemporal single-cell transcriptomic data
【字体:
大
中
小
】
时间:2025年12月05日
来源:npj Systems Biology and Applications 3.5
编辑推荐:
这篇前瞻性综述系统梳理了基于最优传输(OT)和薛定谔桥(SB)等数学框架的时空动态生成模型(stDGM),为从时序单细胞转录组数据中重建细胞分化轨迹提供了统一方法论。文章深入剖析了动态OT、非平衡OT、平均场薛定谔桥等核心理论的生物学假设与应用场景,并配套开发了开源工具CytoBridge,助力研究者精准刻画细胞迁移、增殖/死亡、随机波动及细胞间相互作用等多维度动力学特征。
数学基础
细胞生物学过程本质上是动态演化的。从胚胎发生中的谱系分叉到组织再生与疾病中的渐进性重塑,细胞在时间和空间上持续演变。理解这些转变不仅需要高分辨率分子测量,更需要能够将静态观测连接成连续轨迹的计算方法。近年来,单细胞和空间组学技术的发展极大扩展了细胞状态的测量能力。单细胞RNA测序(scRNA-seq)揭示了细胞类型和状态的多样性,而时间分辨scRNA-seq支持跨多个时间点的采样。空间转录组学(ST)为这些测量引入了空间背景,时间序列空间转录组学的出现则提供了同时研究细胞组织跨时空变化的机会。这些技术共同标志着从静态细胞图谱向生物过程的动态时空重建迈出了重要一步,并构成了近期构建AI赋能的虚拟细胞的基础。
尽管取得了这些进展,大多数基于组学的数据仍然是碎片化的。例如,基于快照的scRNA-seq仅提供每个细胞的单时间点测量。因此,伪时间推断和RNA速率等方法被开发出来,以从这些静态数据中推断动力学,根据剪接动力学将细胞沿潜在轨迹排序或推断变化的方向。这些方法虽然极具价值,但本质上是为单时间点快照数据设计的。与此同时,时间序列数据,如时间分辨scRNA-seq或时间序列ST,直接捕获了跨多个时间点的群体水平变化,并具有重建真实细胞轨迹和调控机制的潜力。利用这些更丰富的数据集需要专门的数学和计算框架,其范围超出了基于单张快照的工具。
随后,一系列动态建模策略被提出,包括基于动态系统(例如常微分方程ODE、随机微分方程SDE和偏微分方程PDE)的表述,以及生成框架,如最优传输、流匹配、非平衡传输、薛定谔桥和平均场方法。这些方法提供了强大的工具来耦合跨时间的分布,并解释增殖、死亡、噪声和细胞间相互作用。每个框架都有其独特优势,并且非常适合分析多时间点或时空数据。
本综述采取了一个独特的视角。我们特别关注于为分析时间序列单细胞和空间转录组学数据(包括时间分辨scRNA-seq和时空ST)而设计的方法。我们旨在提供一个统一的、生物学上易于理解的框架:(i)以直观的方式介绍数学概念和基础,(ii)回顾关键算法,重点关注其数据需求、设计原理和实际应用,以及(iii)为在实际生物学研究中选择、应用和解释这些方法提供实用指南。通过阐明数据类型、建模选择和生物学见解之间的联系,本综述将成为理论进展与实验实践之间的桥梁,使研究界能够更有效地将动态建模整合到其研究中。为此,我们引入了时空动态生成模型(stDGM)的概念,这是一个在概念上涵盖所讨论方法并在我们配套软件包CytoBridge中实现的框架。
算法实现
本节总结了基于上述数学理论实现的现有轨迹推断算法。通常,这些方法旨在学习从一个分布到另一个分布的“最优”映射,这可以通过点对点对应关系或数据空间内的连续流来诱导,并由细胞状态转换过程的“作用量”形式决定。我们根据三个特征对这些轨迹推断方法进行分类:数据假设、建模策略和训练方法。
不同的轨迹推断方法依赖于对输入数据的不同假设,反映了不同类型的生物学先验。例如,一些方法提出考虑细胞分裂和死亡的影响,这会导致分布中的总质量不归一化(非平衡数据)。在这种情况下,假设分布遵循非平衡福克-普朗克方程,并使用静态非平衡OT距离或WFR距离作为作用量。采用非平衡数据假设的典型方法包括TIGON、DeepRUOT和stVCR。
在scRNA-seq数据中,基因表达计数本质上是离散的,通常遵循计数分布,如泊松分布或负二项分布(计数数据)。因此,数据点无法在数据空间内连续演化。为了捕捉连续细胞命运的连续演化,一种方法是对参数化概率测度的动力学进行建模,并采用测地线距离(例如,在有限维统计流形上通过Fisher信息度量定义)作为作用量泛函,然后采用最小作用量方法来计算转移路径。例如,Euclidean VAE通过假设VAE的解码器是从潜在空间到概率测度流形的平滑映射,并直接考虑潜在空间中的演化轨迹来采纳这一思想。
大多数计算方法假设数据存在于欧几里得空间中;然而,scRNA-seq数据通常受内在生物结构支配,因此更好地表示为位于低维流形上(低维流形)。例如,尽管基因表达测量是在G维基因空间中收集的,但细胞状态通常仅占据由调控程序、发育谱系或其他生物约束决定的受限区域。因此,数据的有效维度远低于G。像MIOFlow和Metric FM这样的方法利用了数据背后的低维流形结构,并在该流形中进行测地线插值,而不是在欧几里得空间中。Wasserstein Lane-Riesenfeld(WLR)算法通过测地线的迭代平均来近似Wasserstein空间中的B样条曲线。同时,像Topological Schrodinger Bridge这样的方法将数据向量的每个维度视为无向图顶点上的特征,从而将图上的扩散指定为薛定谔桥问题中的参考过程。
有时,分析的数据点是从不同模态(例如,转录组、蛋白质组或形态学测量)或来自不同生物系统(例如,跨个体、组织或发育时间点收集的样本)采样的,具有不同的度量空间(跨域映射),使得直接在这些数据点上定义最优传输问题变得困难。用于分析和处理此类跨空间数据的典型理论是GWOT,它利用每个流形上数据点之间的测地距离计算传输计划,从而评估两个流形几何结构的相似性。基于此框架,MOSCOT、GENOT和SCOT+等方法应用GWOT理论来解决轨迹推断任务中的多模态和跨系统整合挑战。
在单细胞组学中,空间转录组学数据是一种特殊类型的数据,它不仅包含细胞内的基因表达计数,还包含每个细胞的物理空间位置信息(空间数据)。像stVCR、Dest-OT和STORIES等方法专门设计用于处理此类数据。DeST-OT和STORIES都采用融合Gromov-Wasserstein OT(FGWOT)来模拟跨时间的空间转录组学。更具体地说,DeST-OT通过在静态OT框架内采用半非平衡OT来纳入细胞增殖,而STORIES直接使用FGWOT作为损失函数来重建基因表达动力学。stVCR没有使用GWOT相关理论,而是应用RBTI-OT来模拟空间坐标,这使得在连续设置中同时重建细胞分化、迁移和增殖动力学成为可能。此外,还开发了其他与时空数据相关的应用。例如,PASTE和PASTE2采用Gromov-Wasserstein OT框架对齐相邻的组织切片。CODA使用基于图像配准的方法来对齐组织学图像并从连续切片重建3D组织。此外,其他方法侧重于为scRNA-seq数据推断空间位置;例如,STALocator使用监督自编码器将单细胞定位到ST数据上,而iSORT通过迁移学习将基因表达映射到空间位置。
最后,在扰动研究中,基因表达矩阵通常伴随分类标签或其他实验条件(例如,处理类型、剂量或时间点),这需要在训练或推理过程中明确纳入(条件建模)。像CFGen和CellFlow这样的方法在指定扰动下生成细胞状态,而MMFM将轨迹推断框架扩展到考虑条件信息。
轨迹推断方法在所采用的动力学模型上也各不相同,这些模型可以用离散或连续的时间和空间来表述。动力学模型的选择规定了控制方程的基本结构,而推理过程则估计未知组成部分(通常是时间相关的标量或向量场)。当分布的连续时间演化不是主要关注点时,可以采用离散时间动力学,专注于将某个时间点观察到的细胞状态映射到后续时间点的状态。像Waddington OT、MOSCOT等方法采用这种设置。特别是,高斯混合模型之间的最优传输存在解析解,scEGOT利用了这一点。此外,OTVelo尝试使用离散OT的解来估计RNA速率。离散OT也有几个变体。例如,HM-OT可以通过为每个数据点学习潜在表示并确定潜在表示中的转移矩阵来处理部分观测数据。通过协调离散和连续时间建模,CT-OT Flow方法从数据中估计高分辨率时间标签,然后进行OT问题求解并重建连续的ODE/SDE动力学。
在实践中,细胞过程受到大量未观测到的扰动和内在变异性的影响,底层确定性动力学的粗粒度化自然会产生随机动力学。推断这种随机动力学的一个原则性框架由薛定谔桥提供。该表述用布朗运动项增强了单粒子动力学,并在相应的福克-普朗克方程中引入了扩散项,同时保留了与动态最优传输相同的作用量泛函。像SB between Gaussian、SF2M、PISDE、FBSDE Model、Probability Flow Inference和Likelihood Training SB等方法讨论了薛定谔桥问题的各种解决方案。其中,SB between Gaussian为高斯混合边际分布的情况提供了解析解;Likelihood Training SB模仿得分匹配中的似然训练,为求解薛定谔桥问题提供了一个框架。提出了几种方法来解决更广义的薛定谔桥问题。例如,Lagrangian SB允许求解粒子分布在任何给定势场中的演化;mvOU-OTFM将薛定谔桥的参考过程设置为OU过程;而Smooth SB采用平滑高斯过程作为参考过程。为了处理分支数据以改进下游任务(如细胞命运预测),Branched SB将单个初始分布与具有不同权重的多个终端分布进行匹配。此外,为了同时解决前面提到的非平衡分布和随机动力学问题,Pseudo Dynamics使用带有扩散和非平衡项的福克-普朗克方程,并采用最大似然估计来确定参数;Unbalanced Diffusion SB提出了一种包含生长和死亡的薛定谔桥;ARTEMIS在VAE的潜在空间中求解这样的薛定谔桥,进一步增强了模型的表达能力;DeepRUOT采用了RUOT框架,其中福克-普朗克方程包含扩散和非平衡项,使用WFR距离作为作用量。
与常用的一阶动力学框架相比,纳入动量动力学可以模拟更复杂的细胞过程,其中转录变化的历史或“惯性”会影响未来的细胞状态。像3MSBM这样的方法明确考虑了这种效应。此外,许多现有方法假设细胞是独立演化的;然而,在生物系统中,这个假设常常被违反。由配体-受体信号传导或细胞间接触等过程产生的细胞间相互作用动力学在塑造细胞命运轨迹方面可以发挥核心作用。为了解决这个问题,包括MetaFM、scIMF、GraphFP和CytoBridge等方法将细胞间相互作用纳入轨迹推断。
轨迹推断方法在训练范式上也有所不同。一类基础方法建立在神经ODE框架之上。例如,TrajectoryNet和scNODE通过演化一个经验粒子系统来近似群体动力学,其中向量场由神经网络参数化以捕捉底层转录动力学。相关的泛函和作用量以及分布匹配误差可以从这个神经ODE表述中计算出来,并纳入损失函数中进行基于反向传播的训练。一个最近的替代方案Cell-MNN,通过预测系统的线性算子来学习动力学的局部线性化ODE表示。为了进一步解决高度不平衡的细胞状态分布的挑战,TIGON采用加权粒子系统,通过额外参数化增长率来近似细胞质量和密度的演化。为了解决随机动力学,PISDE和Var-RUOT也采用了神经SDE方法。
然而,基于神经ODE或SDE的方法在训练过程中需要对连续动力学进行迭代数值积分,这会导致计算开销。因此,当应用于高维基因表达空间或大规模单细胞数据集时,其可扩展性受到限制。作为回应,一系列以条件流匹配为代表的无模拟训练方法应运而生。这些方法通常基于简单情况(例如,将狄拉克分布映射到另一个狄拉克分布)的解析解设计,允许直接估计目标标量场或向量场,而无需模拟ODE。SF2M使用流匹配方法解决薛定谔桥问题;Score-Based NF使用流匹配方法解决得分匹配中PF-ODE的向量场;Unbalanced Monge Map和VGFM将非平衡最优传输与流匹配相结合。特别是,VGFM可以同时学习非平衡动态OT框架中的v和g,以处理非平衡分布。Curly FM能够学习非梯度向量场,而Metric FM首先估计低维流形上的测地线,然后进行测地线插值。此外,Wasserstein FM直接在概率测度空间中进行插值,并已被证明在生成高维分布方面有效;MMSFM允许通过多边际SB连接不同时间点的数据。
此外,最优传输及其变体的一阶最优性条件可以通过变分原理推导出来,为设计高效的计算算法提供了基础。PRESCIENT、Action Matching和PISDE将动态搜索空间约束为标量场梯度的集合,其中HJB方程在PISDE中作为损失项强制执行。Wasserstein Lagrangian Flow通过在参数化概率测度上拟合协变向量以及参数化概率测度来解决最优传输及其变体。GraphFP基于庞特里亚金极大值原理设计了一种梯度下降法来求解最优控制律。HJ-Sampler使用Cole-Hopf变换将非线性问题转化为可处理的线性或半线性形式,然后通过求解HJB方程推导出控制律,最终获得数据的后验分布。最近,Var-RUOT进一步证明,基于HJB框架,仅参数化单个标量函数就足以解决RUOT问题。
实践指南
为了帮助研究人员利用所提出的时空动态生成模型(stDGM)框架,此处概述了应用动态生成建模工具的指南,涵盖了从数据输入到生物学发现的整个工作流程。具体来说,为了将这些原则付诸实践,我们正在积极开发CytoBridge,一个集成了整个工作流程的Python包,并邀请社区贡献以帮助塑造其未来。下面我们描述了应用CytoBridge进行时空组学数据分析的设计理念和工作流程。我们还在Box 1中提供了一个案例研究,以演示使用CytoBridge的stDGM工作流程。
stDGM主要应用于时间分辨的scRNA-seq数据或空间转录组数据。所需的输入是一个基因表达矩阵,以及每个细胞的元数据,关键是指定其采样时间点,如果可用,还包括空间坐标。初始步骤,数据预处理,对于最小化技术噪声至关重要。此过程涉及对基因表达数据进行归一化以校正文库大小变异,并对齐不同时间点的空间坐标。然后,利用高变基因的特征选择来分离驱动细胞变化的信号。随后,将基因表达数据投影到低维空间。推荐使用PCA和自编码器等方法,因为它们是可逆的,允许将向量从降维空间投影回原始基因表达空间。这一特性对于实现对特定基因和通路的下游分析至关重要。通常,这个投影空间应保持在100维以下,因为更高的维度可能会模糊驱动细胞分化的关键因素。这些预处理步骤可以使用CytoBridge执行,如Box 1的步骤1所示。
有了干净且结构良好的数据集后,核心分析开始:应用和配置动态模型。这些方法通过使用神经网络模拟细胞状态变化的驱动因素,从离散时间点快照重建轨迹。CytoBridge包支持四个主要建模组件:速率网络、生长网络、得分网络和相互作用网络。每个组件对应一个特定的基于stDGM的框架。然后,一个关键步骤是选择合适的动态模型,这一选择由对系统所做的生物学假设指导。
第一个考虑因素是细胞生长项。如果不同时间点的细胞数量变化不显著,或由于技术采样伪影,或不是生物学兴趣所在,则可以应用仅专注于匹配概率分布的标准动态OT公式。代表性方法包括MioFlow或OT-CFM。然而,用户仍需警惕由不平衡样本量引起的假阳性转换,并考虑某些重采样策略。实际上,如果群体大小变化显著,或反映了真实的生物过程(如发育),则建议包含生长项以获得更深入的见解和更准确的推断。这将分析置于非平衡最优传输框架内,通常需要额外的神经网络来模拟生长,如TIGON和最近提出的无模拟方法VGFM所实现。在此类方法中,速率网络和生长网络用于同时匹配不同时间点的分布和细胞数量。利用动态非平衡OT框架的示例可以在Box 1的步骤2中找到。
第二个考虑因素是随机性。为了捕捉生物过程固有的随机性,如果不考虑生长项,可以将问题框架化为薛定谔桥问题。这可以通过直接模拟神经SDE(如PI-SDE)来解决,或者通过增强确定性向量场加上一个得分匹配网络来模拟概率密度(如SF2M所示)。对于同时表现出非平衡生长和随机性的系统,正则化非平衡最优传输(RUOT)框架是合适的,如DeepRUOT和Var-RUOT等方法所实现。
最近,建模的范围已扩展到通过新提出的非平衡平均场薛定谔桥(UMFSB)问题纳入细胞间相互作用。UMFSB框架可以同时推断相互作用、生长和随机效应。基于这一理论构建的CytoBridge包旨在作为一个统一工具包。它使用户能够选择性地停用相互作用、生长或随机项,从而精确定制分析以适应其特定数据集和生物学问题。
工作流程的下一阶段是下游分析和解释。可视化通常是第一步,将推断出的速率投影到低维嵌入(如UMAP)上。这提供了发育流和主要预测谱系路径的直观视图。此外,如果可用,生长网络可以揭示表现出较高增长率的特定细胞类型。得分网络识别对应于稳定细胞命运的高密度区域,这类似于Waddington表观遗传景观中的谷值。使用CytoBridge进行基本可视化的用法见Box 1的步骤3。除了可视化,训练好的神经网络是可解释的模型,能够进行强大的定量分析。例如,学习到的速率场可以通过计算其雅可比矩阵来推断基因调控网络(GRN)。类似地,生长网络的梯度可以识别驱动细胞增殖的关键基因。这一原理扩展到包含细胞间相互作用的模型。模拟细胞相互作用的方法可以区分细胞固有的分化驱动与细胞间通讯的影响。通过分析相互作用力的性质,可以识别哪些基因对邻近信号最敏感,并通过计算相互作用力与内在漂移的相似性的空间自相关来表征相互作用本身的性质。对于这些分析,可以将低维空间的结果投影回原始基因空间以确保生物学可解释性。从这些不同分析产生的高影响力基因列表,无论是GRN枢纽、增殖驱动因子还是相互作用靶点,都可以进行基因集富集分析(GSEA)。这一步将单个基因与其共同代表的更广泛生物学通路和功能联系起来,完成了从数据到机制见解的桥梁。因此,可以以直接的方式应用对特定驱动基因的计算机扰动。同样值得注意的是,整合了速率、得分以及(如果可用)相互作用项的整体漂移,提供了细胞动态的综合表征。这种漂移与其他下游分析工具(如scVelo)兼容,因此可用于计算细胞到细胞的转移矩阵和速率图。构建的图可以随后应用于CellRank来推断命运概率或驱动基因。这些stDGM方法与更广泛的下游分析工具生态系统的无缝集成为更广泛的分析可能性打开了大门。
这里讨论的stDGM方法的一个基本优势,也是它们与静态方法的区别,在于它们被表述为生成模型。这种生成能力允许人们从初始群体分布随时间向前模拟整个细胞轨迹。因此,这些模型不仅可以重建离散时间点观察到的细胞分布,还可以插值预测在未观测时间点的细胞状态。因此,工作流程的最后一步侧重于这种轨迹重建。一旦轨迹建立,它们提供了单个细胞命运的显式映射,揭示哪个细胞状态演变为另一个状态。这使得能够直接分析细胞类型沿谱系的转换。为了实现这一点,通常需要细胞注释步骤,其中训练一个分类器从基因表达向量预测细胞类型。通过将这些标签应用于模拟轨迹,可以构建完整的谱系命运图谱,为发育和分化的潜在生物学机制提供可解释性。例如,TrajectoryNet在胚状体数据集上使用生成的轨迹来识别注定走向不同命运的细胞的基因表达谱在早期何时开始分化。在同一数据集上,MIOFlow生成轨迹并将其解码回全基因空间,以准确重建单个基因的复杂、非单调表达动力学,这与已知生物学知识一致。TIGON在上皮-间质转化(EMT)数据集中对未测量时间点的数据进行插值,揭示了随时间变化的细胞间通讯模式。我们在Box 1的步骤4中展示了CytoBridge生成轨迹的功能,并在图4中使用CytoBridge可视化小鼠造血数据集的生成轨迹。
然而,当前的生成模型仍然存在几个关键局限性。一个主要挑战是时间泛化。虽然模型在训练时间范围内可能擅长插值,但当预测远超出该范围时,其准确性通常会下降,因为底层的生物调控动力学可能会发生变化。另一个潜在问题是对初始条件和采样噪声的敏感性;早期时间点数据中的误差或偏差可能在模拟过程中被放大,导致发散和生物学上不可信的轨迹。此外,跨不同细胞类型的泛化可能有限;在特定分化通路上训练的模型可能无法预测罕见或先前未见谱系的出现。严格验证生成的轨迹仍然是一个挑战。当可用时,实验谱系追踪可以作为确认的标准。
Box 1:使用CytoBridge进行stDGM分析的演示
本框提供了使用CytoBridge Python包分析时间序列单细胞数据的实用指南,对应图3中概述的工作流程。我们使用一个小鼠造血数据集作为概念示例来演示如何执行stDGM分析。该数据集结合了时间序列单细胞RNA测序和条形码技术,将小鼠造血祖细胞的初始转录组状态与其分化后的克隆命运联系起来,包含在三个时间点收集的49,302个具有谱系追踪信息的细胞。
- 1.
第一步是将数据加载到AnnData对象中。然后我们使用内置的CytoBridge预处理函数,该函数处理归一化、高变基因选择和降维。在以下示例代码中,使用PCA将维度降至50。参数time_key='Time'指定了adata.obs中包含每个细胞采样时间点的列名。dim_reduction='PCA'指定了降维方法。处理后的特征将存储在adata.obsm['X_latent']中用于模型训练。
adata = scanpy.read_h5ad("mouse_hematopoiesis_data.h5ad")
cytobridge.pp.preprocess(adata, time_key='Time', dim_reduction='PCA')
- 2.
接下来,我们从stDGM框架中选择一个模型并对其进行训练。这是通过cytobridge.tl.fit函数完成的,其中config参数允许用户根据其生物学假设选择合适的理论模型。对于小鼠造血数据集,研究方案涉及培养祖细胞并在第2、4、6天进行采样,细胞在初始时间点后重新铺板以允许持续增殖和分化。这确保了观察到的细胞数量增加是生物生长的直接结果,这是非平衡框架专门设计的动态。因此,我们选择动态非平衡OT框架进行stDGM分析。
cytobridge.tl.fit(adata, config='unbalanced_ot')
训练好的动态模型被存储回adata.uns中,可以方便地加载用于后续下游分析。
- 3.
此阶段的基本下游分析是对原始数据集中学习到的速率和生长速率进行可视化。这些量可以通过使用cytobridge.tl.analysis模块中的函数加载先前训练的模型来计算。
cytobridge.tl.analysis.compute_velocity(adata)
cytobridge.tl.analysis.compute_growth(adata)
计算出的速率和生长速率将自动存储在adata.obsm['velocity_latent']和adata.obsm['growth_rate']中,随后可以投影到UMAP坐标上绘制。对于小鼠造血数据集,速率流线图清楚地显示了不同的分化轨迹,这与不同的细胞命运一致。预测的生长速率也可以通过与该数据集的谱系信息进行比较来验证。具体来说,预测具有较高增长率的区域对应于未分化的祖细胞,这些细胞预计在后期时间点会产生更大的克隆(通过共享条形码识别)。给定计算出的速率和生长速率,可以通过将这些量与scVelo和CellRank结合来进行更高级的下游分析。
- 4.
为了重建整个细胞轨迹序列,我们在cytobridge.tl.analysis和CytoBridge.pl.plot中实现了生成和可视化例程。
cytoBridge.tl.generate_ode_trajectories(adata=adata)
cytoBridge.pl.plot_ode_trajectories(adata)
这些例程模拟并可视化在由速率和生长驱动的动态模型下的多步轨迹,从而保持了细胞状态转换的完全连续性。这些生成的轨迹提供了小鼠造血数据集分化的动态可视化,详细描述了细胞从其初始祖细胞状态向多样化谱系特异性命运移动的连续过程。值得注意的是,generate_ode_trajectories读取瞬时生长速率,为每个细胞分配一个权重。权重变化比r指导决策:r > 1的细胞概率性地产生后代细胞,而r < 1的细胞基于随机采样被保留或淘汰。这种逻辑准确地模拟了小鼠造血系统中细胞的概率性分裂和死亡。
结论与未来展望
本综述讨论了时空动态生成模型(stDGM)在单细胞和空间转录组学方面的最新进展,特别侧重于从时间序列scRNA-seq和时空数据解析细胞命运轨迹。我们首先介绍了动态系统和生成建模的数学基础,包括最优传输和薛定谔桥公式,强调了这些概念如何为重建和生成细胞动态提供一个框架。然后,我们回顾了在实践中实现这些框架的算法进展。最后,我们提供了实用指南,以帮助研究人员为不同类型的应用场景选择和应用这些方法。通过整合数学原理、计算方法和生物学应用,我们的目标是为细胞动态的研究提供一个系统且易于理解的视角。
展望未来,一个重要的方向是整合更丰富的数据模态,将转录组时间序列与表观基因组、蛋白质组和成像测量相结合,以提供更全面的调控动态视图。另一个有前景的方向是结合谱系追踪和克隆记录技术,这将允许计算推断的轨迹通过实验观察的祖先关系进行验证和细化,从而加强命运决定的生物学解释。空间和时间分辨率的进步也将使得明确耦合细胞内动态与细胞间相互作用和组织水平组织成为可能。重要的是,整合细胞力学研究将有助于模拟物理空间中的细胞形态发生,为发育和疾病提供多尺度视角。最后,将计算软件包持续改进为用户友好和易于访问的工具,对于使更广泛的研究者群体能够在实践中应用这些方法至关重要。这些发展共同指向一个未来,即动态建模不仅是一个理论框架,也是实验生物学的一个实用组成部分,加深我们对发育、再生和病理过程中细胞动态的理解。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号