《Nature Communications》:Integrated multi-omic atlas reveals the hierarchy of spatiotemporal regulatory networks of mouse gastrulation
编辑推荐:
本研究通过构建小鼠原肠胚形成时期的高分辨率单细胞多组学图谱(ST-MAGIC),结合新算法BioCRE解析基因-增强子关联,首次系统阐明了左右体轴不对称打破的多组学基础及轴向内中胚层谱系发育过程中转录因子(如EOMES、FOXA2、NOTO/POU6F1)与信号通路(NODAL、WNT)的级联调控逻辑,为理解哺乳动物胚胎发育的时空协调机制提供了重要框架。
胚胎发育如同谱写一首精妙的生命交响曲,其中原肠胚形成阶段尤为关键——此时,一个看似简单的细胞球将经历剧烈重组,分化出未来所有器官系统的前体细胞,并初步建立身体的前后、背腹和左右轴线。然而,这一过程的时空动态性极强,细胞命运决定和组织模式形成背后的分子调控网络(GRN)如同一个精密计时器,其运作机制至今仍有许多未解之谜。传统单组学技术往往破坏了胚胎发育的时空连续性,难以捕捉其快速变化的全貌。为了解决这一难题,研究人员在《Nature Communications》上发表了最新研究成果。
为了回答这些问题,杨先发等人开展了系统性研究。他们构建了小鼠原肠胚形成早期(E6.5)至晚期(E7.5)的时间序列单细胞多组学图谱(转录组+染色质可及性),涵盖35,449个细胞。利用新开发的基因-顺式调控元件预测算法BioCRE,建立了基因-增强子关联网络。通过整合基于Geo-seq的真实三维空间转录组坐标,构建了ST-MAGIC和ST-MAGIC(+)图谱,从而能够在单细胞分辨率下解析调控网络的时空动力学。
关键技术方法
研究主要关键技术包括:时间序列单细胞多组学(10x Genomics平台)测序分析小鼠原肠胚;开发BioCRE算法精准预测基因-增强子关联;利用Tangram算法将单细胞数据映射至Geo-seq定义的时空坐标,构建ST-MAGIC图谱;整合SCENIC+推断转录因子调控网络(eRegulon)及公共ChIP-seq数据(如β-Catenin、Smad2/3),构建ST-MAGIC(+)平台分析信号响应性;应用CRISPR-Cas9技术构建基因敲除小鼠模型(Noto、Pou6f1)和胚胎干细胞系进行功能验证。
单细胞多组学捕捉胚层形成的基因调控网络
研究人员首先获取了五个关键发育时间点(E6.5, E6.75, E7.0, E7.25, E7.5)的高质量单细胞多组学数据。细胞分型鉴定出31种细胞类型,并首次将脊索谱系细分为四个亚群。通过新开发的BioCRE算法,研究者成功建立了基因与其潜在调控元件(CRE)之间的关联,该算法在预测细胞类型特异性调控元件方面表现出优于现有工具(Signac, ArchR)的性能。例如,研究不仅确认了已知的Mesp1基因增强子EME,还发现了一个新的关键调控元件Neo_ME,并通过报告基因和基因敲除实验验证了其功能。
原位硅细胞时空多组学图谱
研究团队利用已发表的具有真实空间坐标的转录组数据(Geo-seq),将单细胞多组学数据重构至三维胚胎模型中,形成了ST-MAGIC图谱。该图谱能精确展示细胞类型、基因表达和染色质可及性的空间分布。研究证实了中胚层亚型(如心脏中胚层、间充质细胞等)在胚胎中的区域化分布。更重要的是,利用ST-MAGIC分析了E7.5胚胎左右近端中胚层(LPM/RPM)的多组学基础,发现两侧不仅细胞类型组成不同,染色质可及性也存在显著不对称,其中左侧富集的峰值与体节发生、心脏发育相关,而右侧则与BMP信号通路相关。研究还鉴定了一个新的Lefty2调控元件Neo_LRE。
ST-MAGIC(+)推断增强子调节子的时空更替
通过整合SCENIC+推断的eRegulon,研究构建了ST-MAGIC(+)平台,用于可视化转录因子调控网络的时空动态。研究发现,在发育过程中,转录因子与其靶基因/靶峰的可及性存在普遍的时空异步性。例如,转录因子T的靶峰可及性范围比其自身表达范围更广,提示其可能作为“预开放”因子为后续细胞命运决定准备染色质环境。对于NOTO,其靶峰在E7.0阶段的前原条区域就已变得可及,远早于Noto基因本身的表达,且这些区域富集WNT和NODAL信号效应子的结合 motif,表明关键信号通路参与了NOTO靶向染色质模式的预先建立。
ST-MAGIC(+)反映对发育信号响应的时空动态
研究系统分析了胚胎对WNT和NODAL信号的固有染色质响应性。对于WNT信号,EpiLC(类上皮干细胞)特异的β-Catenin结合峰在原始条纹及其邻近的后部中胚层区域持续可及。对于NODAL信号,EB(类胚体)特异的Smad2/3结合峰的可及性在E6.75至E7.0期间就开始从原条区域向远端重定位,早于Nodal配体梯度本身在E7.25至E7.5期间的重新排布。研究进一步聚焦于E7.0阶段前原条-中胚层(APS_M)区域特异的信号响应峰,发现它们分别与不同的生物学过程和转录因子 motif 相关,其中NODAL信号响应峰的重定位可能与后续轴向内中胚层的发育密切相关。
轴向内中胚层谱系发育的分子层级结构
通过对轴向内中胚层谱系(起源于E7.0前原条,最终分化为E7.5的结节点和前内中胚层)的深入分析,研究揭示了该谱系发育的清晰分子层级。RNA速率和伪时间分析显示细胞命运流向。更重要的是,SCENIC+分析发现转录因子的使用存在明确的先后顺序:多能性因子(如Nanog)→ 早期谱系因子(如EOMES)→ 中期因子(如MIXL1、FOXA2、LHX1)→ 终端因子(如NOTO、POU6F1、SOX9)。早期和中期因子先上调自身表达,进而打开靶基因和靶峰;而终端因子(如NOTO、POU6F1)的靶峰染色质则提前(在E7.0 APS阶段)就已变得可及,随后才是转录因子表达和靶基因激活。ChIP-seq和基因敲除实验证实,EOMES和FOXA2对于打开终端因子(如Foxj1)的靶峰至关重要。
不同阶段转录因子在调控基因表达和建立染色质可及性中的不同作用
为了验证上述层级模型,研究者生成了Noto和Pou6f1基因敲除小鼠。发现敲除后,E7.5胚胎的结节点相关基因和纤毛发生严重受损,体内纤毛长度变短,E11.5时体轴转向随机化,但终端因子靶峰的染色质可及性并未发生改变。这表明NOTO和POU6F1主要作为转录调控级联的“最终执行者”,负责建立终端的转录组状态,而不负责染色质环境的初始设定。
本研究建立的ST-MAGIC和ST-MAGIC(+)资源,首次在时空维度系统描绘了小鼠原肠胚形成过程中的连续分子事件级联,揭示了转录因子和信号响应性在细胞命运决定中的层级逻辑。研究提出了轴向内中胚层发育中存在的“预开放-特化-决定”分子级联模型,深化了对哺乳动物胚胎发育分子原理的理解。该研究提供的数据资源和分析框架将为未来发育生物学研究提供重要支持。尽管当前资源在空间分辨率、数据模态和部分GRN推断的精确性上仍有提升空间,但无疑为在时空背景下系统学习早期哺乳动物胚胎发生的分子规律开辟了新途径。