编辑推荐:
为探究单细胞染色体结构变异对基因功能的影响,研究人员开展相关研究,发现染色体构象可聚类,且与基因转录有关,为揭示基因组功能调控机制提供依据。
染色体作为遗传信息的重要载体,其结构与功能一直是生命科学领域的研究热点。在细胞的微观世界里,染色体的三维结构并非一成不变,而是充满了动态变化。以往研究发现,利用单细胞超分辨率成像、单细胞基因组学实验以及数据驱动的基因组建模等技术,虽然能够在单细胞水平分析染色体和整个基因组的三维结构,但染色质环、拓扑相关结构域(TADs)等在单细胞层面存在很大的随机性变化。例如,在哺乳动物细胞的整体 Hi-C 实验中检测到的染色质环,在任何给定时间可能仅存在于 3% - 6.5% 的细胞中,TAD 结构域边界也并非固定在整体平均位置,而是随机分布。并且,目前对细胞间整个染色体的结构变异及其在长程染色质相互作用的细胞间变异性中的作用研究较少,也缺乏在亚核环境背景下研究染色体构象状态的高分辨率方法。
为了深入探究这些问题,相关研究人员开展了一项研究,旨在识别整个人类染色体在单细胞核拓扑结构背景下的普遍三维染色体结构亚群,并研究这些结构变异如何影响细胞核内基因组区域的功能微环境。该研究成果对于揭示基因组结构在基因功能调控过程中的作用具有重要意义。
在研究方法上,研究人员主要运用了以下几种关键技术:一是利用整合基因组建模(IGM)平台,基于群体的三维基因组建模方法生成大量的单细胞三维基因组结构;二是采用两步降维方法,将卷积自动编码器与 t - 分布随机邻域嵌入(t-SNE)相结合,对单细胞三维染色体结构进行聚类分析;三是通过多种实验数据进行验证,如利用多重 DNA-MERFISH 成像和单细胞 sci-HiC 实验数据等。
研究结果如下:
- 结构生成与聚类分析:研究人员首先将方法应用于从整体 Hi-C 数据生成的二倍体三维基因组结构集合。通过 IGM 平台,为每种细胞类型生成了 10,000 个二倍体单细胞三维基因组结构,这些结构能很好地再现输入的 Hi-C 数据,并准确预测其他正交实验数据。研究人员从每个细胞群体的全基因组结构中分离出单个染色体拷贝,构建归一化距离矩阵,然后使用两步降维方法将染色体结构聚类为形态状态。通过轮廓分析和计算平均 Wasserstein 距离等指标评估聚类性能,结果表明不同聚类中的染色体结构在降维空间中分离良好,且聚类内的结构相似性更高。
- 聚类方法的稳健性评估:研究人员对聚类方法的稳健性进行了评估。结果显示,随着输入结构数量的减少,检测到的聚类数量会下降,但高占有率的聚类始终能被识别,且平均距离矩阵几乎相同,表明该方法即使在输入规模较小时也具有稳健性。此外,降低染色体结构的分辨率后,仍能识别出部分原始聚类,且接触模式相似。同时,负向和正向对照实验也进一步验证了该方法的有效性。
- 染色体构象特征:研究发现,根据具体染色体的不同,约 25% - 50% 的染色体结构可聚类为 5 - 12 种普遍的形态状态。这些染色体形态通过染色体 territory 域(chromosome territory domain)来区分,大多数聚类在平均距离和接触频率矩阵中显示出明显的边界,将染色体 territory 划分为空间细分区域,区域内接触频率增加,区域间接触频率降低。这些边界位于染色体的特定位置,其序列位置和 territory 域大小对接触概率的衰减率有重要影响。
- 实验验证:研究人员利用多重 DNA-MERFISH 成像和单细胞 sci-HiC 实验数据对研究结果进行了验证。尽管 DNA-MERFISH 成像数据的样本量较小且覆盖度较低,但仍有超过一半的结构与预测的聚类形态具有较高的结构相似性,且平均距离矩阵证实了 territory 域边界的位置。单细胞 sci-HiC 数据经处理后,其平均接触频率图与模型结果吻合良好,也验证了研究结论。
- 染色体形态的影响:染色体形态对染色体区域的核位置有显著影响。研究发现,不同的染色体形态改变了特定染色体区域在核内的优先位置,尤其是在径向位置和与核斑点的距离方面。例如,在染色体 6 的不同聚类中,某些区域的径向位置和与核斑点的距离差异显著,且这些差异与基因转录活性相关。通过模拟 SON TSA-seq 数据和分析 RNA-MERFISH 实验的空间转录组数据,研究人员发现特定染色体区域在不同聚类中的转录水平存在差异,表明染色体构象的变化与基因转录水平相关。
- 染色体 territory 域边界的特征:染色体 territory 域边界具有独特的特征,它们通常位于基因贫乏和基因丰富区域的过渡处,与 Hi-C 亚区室的边界重合,并且常常与 syntenic 断点重叠。在不同细胞类型中,相似的 territory 域边界位置表明其在进化上可能具有保守性。
在结论与讨论部分,研究人员开发的两步密度聚类方法成功将三维染色体结构聚类为普遍的亚群,有助于研究结构随机性在基因功能中的作用。研究发现染色体形态由染色体 territory 域区分,其边界位置对染色体构象变异至关重要,且与进化过程中的基因组重排相关。此外,不同染色体形态在核拓扑结构背景下的差异会影响基因转录水平,这为解释单细胞 RNA 测序实验中观察到的基因转录细胞间异质性提供了新的视角。然而,关于 territory 域边界的起始调控机制仍有待进一步研究。该研究成果为揭示基因组结构在基因功能调控中的作用提供了重要依据,有助于深入理解细胞内基因表达调控的复杂机制。该论文发表在相关领域期刊上。