《Genes》:Single-Cell Multi-Omics Reveal Gene Regulatory Mechanisms Underlying Cardiac Embryonic Development
Enqi Feng,
Xuejia Zheng,
Feng Zhu,
Liu Xiang,
Chengcheng Liu,
Leping Wang,
Yanni Cao and
Yong Dai
编辑推荐:
这篇综述系统性地总结了单细胞多组学技术(包括scRNA-seq、scATAC-seq、空间转录组学等)在解析心脏胚胎发育的细胞异质性、谱系轨迹、基因调控网络(GRN)以及表观遗传机制方面的最新应用。它不仅揭示了关键心脏前体细胞(如第二心区IRX1+细胞)的命运决定过程,还阐明了转录因子(如GATA4、TBX5、ISL1)和信号通路(如Notch、WNT、BMP)如何调控心脏形态发生。通过整合多组学数据,为先天性心脏病(CHD)的病因机制提供了新见解,并探讨了从构建发育图谱到临床转化的挑战与前景。
单细胞多组学:解码心脏胚胎发育的精密蓝图
1. 引言
心脏是胚胎发育过程中最先形成并发挥功能的器官,其形态发生过程极为复杂,涉及精确的细胞命运决定、谱系分化和空间组织。从原肠期的中胚层特化,到心管形成、心脏环化、心室分隔,再到流出道和间隔的最终成熟,每个阶段都依赖于多种信号通路在时间和空间上的精密协同,以及基因调控网络(GRN)的精准执行。单细胞测序技术的出现,彻底改变了我们研究心脏发育的方式。单细胞多组学技术,包括单细胞RNA测序(scRNA-seq)、单细胞转座酶可及染色质测序(scATAC-seq)、空间转录组学等,为构建心脏发育的细胞图谱、解析细胞分化路径、推断GRN提供了前所未有的机会。这篇综述旨在系统总结单细胞多组学技术在心脏胚胎发育研究中的应用,阐述如何解读细胞异质性、动态轨迹和分子调控网络,并探讨其对先天性心脏病(CHD)机制的启示。
2. 单细胞测序技术发展及其在心脏胚胎发育中的应用
技术的迭代发展为解析心脏胚胎发育的复杂过程提供了高分辨率工具。从转录组、表观遗传学到空间多组学的演进,不断拓展着我们对心脏发育细胞异质性、动态调控和微环境相互作用的理解。核心优势在于,scRNA-seq能够解析组织的细胞异质性,为发育过程绘制高分辨率的细胞图谱和基因表达全景图。
- •
2.1. 单细胞RNA测序在心脏胚胎发育中的应用
scRNA-seq通过捕获单个细胞的转录组信息,打破了传统群体测序的平均化局限,成为分析心脏发育细胞异质性的核心手段。这项技术在心胚胎发育的多个核心研究方向,如精细细胞亚群分析、发育轨迹的动态追踪以及细胞通讯网络分析中,展现出强大的应用价值。例如,研究者已成功在小鼠和人类胚胎心脏的单细胞转录组分析中,系统鉴定了心肌、心内膜、心外膜祖细胞等核心细胞类型,并特别聚焦于第二心区(SHF)中的IRX1阳性祖细胞亚群,明确了其在流出道和右心室形成中的关键作用,为后续功能研究提供了精确的细胞靶点。通过拟时序分析等方法,研究者成功绘制了心肌细胞的成熟轨迹,揭示了关键调控基因,并利用CellChat等工具分析了心肌细胞、内皮细胞、成纤维细胞等细胞谱系之间的相互作用关系,为阐明心脏发育的协同调控网络提供了关键线索。
- •
2.2. 单细胞染色质可及性揭示心脏表观遗传调控
单细胞表观基因组测序技术,特别是scATAC-seq,从染色质构象、DNA修饰和组蛋白修饰等多个维度阐明了调控心脏发育的表观遗传网络。其核心在于,染色质可及性作为表观遗传调控的基础层次,直接决定了转录因子等调控蛋白的结合效率,为分析心脏发育的GRN提供了关键切入点。整合分析表明,转录因子ISL1在心脏祖细胞中发挥先驱因子活性,能够结合封闭的染色质区域,并招募SWI/SNF染色质量塑复合体打开染色质构象,协同激活与心肌分化相关的增强子。研究还发现,心脏发育的关键增强子(如TBX5基因的下游增强子)在发育早期会先“预定位”为开放状态,从而指导DNA去甲基化等精确修饰。TBX5基因下游增强子区域的染色质可及性丧失会促进异常甲基化沉积,这种协同异常与房间隔缺损、室间隔缺损等CHD密切相关,并抑制TBX5的正常表达。
- •
2.3. 空间转录组学揭示空间定位与信号传导
空间转录组学技术的出现,有效补充了scRNA-seq缺失的空间维度。通过SEU-TCA等算法,研究者能够精确定位心脏祖细胞并分析其空间微环境中的信号交互。例如,研究表明,在早期小鼠胚胎中,器官原基决定区会协同整合WNT抑制信号和BMP激活信号,驱动心脏和前肠细胞外基质(ECM)的发育。高分辨率空间转录组学技术,如MERFISH,实现了单细胞水平上的空间基因表达分析。对人类胚胎心脏的研究显示,内皮黏蛋白(endomucin)阳性内皮细胞与MYH6阳性心肌细胞在空间上紧密相邻,这为血管生成过程中血管内皮生长因子(VEGF)信号的空间特异性激活提供了直接证据。从临床角度看,这种精确的空间定位对于理解CHD的发病机制至关重要。
- •
2.4. 心脏发育调控中的多组学整合
在心脏发育研究中,单一组学技术由于其自身局限性,难以全面解析复杂的调控网络,因此多组学整合成为必然趋势。scRNA-seq与scATAC-seq的整合分析,可以将染色质的开放状态与基因的转录活性直接关联,从而分析增强子-启动子调控网络。例如,通过此方法,研究者揭示了GATA4结合位点的染色质开放动态与其下游基因在心脏发育过程中的表达时序高度一致。通过整合转录组和蛋白组信息,CITE-seq能够高分辨率地区分心脏发育中的细胞类型,例如将Myl4+Tnni1+单核二倍体心肌细胞(MNDCM)的mRNA与蛋白表达进行功能关联,不仅明确了其关键表型特征,也为其在心脏修复中的作用提供了直接证据。
3. 单细胞多组学在心脏胚胎发育各阶段的应用
单细胞多组学技术已在心脏胚胎发育的各关键阶段得到广泛应用,从细胞图谱构建、谱系追踪到调控机制解析,提供了前所未有的见解。
- •
3.1. 心脏祖细胞起源的原肠胚形成与中胚层特化
在心脏发育的最早阶段,核心生物学问题在于细胞命运如何启动。scATAC-seq特别适用于揭示染色质可及性如何在显性基因表达变化发生前“启动”基因组。研究表明,转录因子Mesp1发挥了关键的分子开关作用,通过抑制体节决定因子T/Brachyury,确保心血管祖细胞特性的建立和维持。其条件性缺失可导致E7.5小鼠胚胎中胚层形成异常。先进的转录组分析进一步阐明了信号调控的特异性,例如Mesp1可以激活包括Wnt3、Wnt5a和Wnt5b在内的关键中内胚层调节因子。此外,Wnt抑制剂Dkk1在诱导脊索和前脊索中胚层发育以及促进非心脏源性中胚层群体的心脏生成中发挥关键作用。
- •
3.2. PDZ与心管形成:空间信号协同主导的阶段
在心管形成阶段,研究重点转向理解形态变化如何在三维空间中被协调。空间转录组学研究表明,在小鼠E7.75胚胎的器官原基决定区,通过构建一个同时表达WNT抑制剂Dkk1和BMP激活剂Bmp4的信号微环境,来协调心脏和前肠原基的同步发育。这个协同信号中枢对于腹壁的正确定位也至关重要,其破坏可能导致严重的正中线异常。单细胞转录谱和克隆分析进一步表明,PDGFRα定义的生心祖细胞亚群展现出与谱系决定相关的独特分子程序,强调了协调的细胞间调控网络在塑造早期心脏形态发生中的重要性。在心管形成阶段,scRNA-seq揭示了心肌细胞开始表达收缩蛋白和离子通道,并启动了心内膜细胞与心肌细胞之间的早期相互作用,为后续心内膜垫形成和心室化奠定了基础。
- •
3.3. SHF祖细胞分化与心脏心室化
SHF祖细胞是流出道和右心室形成的关键细胞来源。通过小鼠和人类胚胎心脏的单细胞转录组分析,已鉴定出SHF祖细胞的异质性亚群,包括IRX1阳性祖细胞。结合时序分析,scRNA-seq可进一步追踪SHF祖细胞的分化轨迹。功能验证表明,IRX1是SHF发育的关键调节因子,其敲低会导致流出道和室间隔缺损,强调了IRX1+祖细胞正确迁移和分化的重要性。此外,SHF祖细胞的发育受BMP和FGF信号的协同调节。在心室形成过程中,scRNA-seq揭示了Notch信号在不同心脏区域的独特作用。
- •
3.4. 心肌细胞成熟与代谢重编程
心肌细胞成熟是心脏发育的最后关键阶段,其功能和表型稳定性的建立直接影响心脏的正常生理功能。scRNA-seq和CITE-seq等技术为分析此过程提供了有力工具。研究发现,Myl4+Tnni1+单核二倍体心肌细胞(MNDCM)从胚胎到成体心脏中持续存在,可能在心脏损伤后的修复过程中发挥重要作用,为理解心肌细胞成熟后的功能可塑性提供了新视角。多组学整合分析进一步揭示,代谢重编程是心肌细胞成熟的核心特征之一——细胞能量代谢模式逐渐从胚胎期的糖酵解依赖转变为成熟期的氧化磷酸化主导。此外,RNA剪接调控也有助于心肌细胞成熟的时间协调。
- •
3.5. 分子调控网络的多组学整合
多组学整合通过连接转录组和表观基因组等不同分子层的数据,极大地加深了我们对心脏胚胎发育分子调控网络的系统性理解。其中,scRNA-seq和scATAC-seq的联合应用已成为核心策略,因其可直接将染色质可及性与转录活性关联,并能够分析增强子-启动子调控关系。例如,通过此整合方法发现,心脏发育关键转录因子GATA4结合位点的染色质开放动态与其下游靶基因的表达时序高度一致。作为心脏祖细胞中的先驱因子,ISL1可结合封闭的染色质区域并招募SWI/SNF染色质量塑复合体,从而协同激活与心肌分化相关的增强子。此外,对DNA甲基化、长链非编码RNA(lncRNA)等调控机制的分析进一步丰富了调控网络的维度。例如,TBX5相关调控区域的DNA异常甲基化与法洛四联症等CHD密切相关,而lncRNA Braveheart通过与PRC2复合体相互作用调控心肌谱系决定。这些发现共同构建了一个多层次的心脏发育调控系统。
4. 数据分析方法与统计模型在心脏发育中的应用
单细胞多组学数据的分析已发展成一个生物问题驱动的框架,从初始数据处理延伸到细胞命运调控的复杂建模。专门的统计模型和计算工具被应用于解决心脏研究中的特定挑战,如识别稀有祖细胞群、表征跨物种进化保守性、重建心脏区域的复杂分支轨迹等。通过整合这些计算策略,研究者能更好地将分子变化与心脏形态发生联系起来,从而更深入地理解结构缺陷的起源。
- •
4.1. 通过靶向数据整合与质量控制解析心脏细胞异质性
数据预处理和质量控制是确保下游生物学见解(如识别稀有心脏祖细胞群)并非技术噪声产物的基石。现代统计框架提供了更精细的解决方案,例如SoupX可对液滴法scRNA-seq数据中的背景RNA进行建模和校正。为降低发育中心脏过渡态被错误分类的风险,DoubletFinder和Scrublet等方法可以识别和去除可能被误认为谱系特化过程中混合细胞状态的双联体。在构建连续的心脏发育图谱时,整合不同胚胎阶段、平台和实验室生成的数据集是一大挑战。Harmony、Seurat等整合方法能够将不同发育阶段的数据投影到统一的低维空间,有助于区分技术变异与心脏前体细胞的真实发育轨迹。
- •
4.2. 心脏细胞身份与状态的精确鉴定
定义细胞类型和状态是单细胞分析的核心挑战。在发育中的心脏中,这项任务包括区分细微的细胞群。基于图的聚类算法,特别是Louvain和Leiden算法,因其能捕捉数据的复杂拓扑结构并对噪声具有鲁棒性,已被广泛应用于心脏图谱构建,以划分不同的发育亚谱系。为应对早期胚胎心脏样本中固有的技术噪声和丢失事件相关的不确定性,概率生成模型引入了更严谨的统计框架。单细胞变分推断(scVI)利用基于变分自编码器(VAE)的贝叶斯框架对数据进行建模,在心脏发育研究中,这种潜在表示对于跨样本整合和解析主要的发育分支点特别有价值。在细胞类型注释方面,AUCell、SCINA等统计方法有助于主要心脏区域的初步识别。此外,监督学习工具如SingleR和scANVI,通过利用已建立的心脏图谱中的高质量参考数据集,能够自动、准确地注释跨物种的保守祖细胞状态。
- •
4.3. 心脏谱系轨迹与命运决定的建模
发育轨迹推断是心脏研究的基石,旨在将静态的单细胞快照转化为动态的拟时间连续体。在