比较染色质接触图谱:方法与见解 —— 探索三维基因组组织的奥秘

【字体: 时间:2025年03月20日 来源:Nature Methods 36.1

编辑推荐:

  研究人员评估 25 种比较染色质接触图谱的方法,为三维基因组组织研究提供重要参考与指导。

  在微观的生命世界里,基因组的三维(3D)结构如同隐藏在细胞深处的神秘密码,它对细胞的发育、物种的进化以及疾病的发生发展起着至关重要的作用。染色质接触图谱就像是解读这一密码的关键钥匙,通过它,我们能够了解基因组在三维空间中的折叠方式。然而,目前用于比较染色质接触图谱的方法五花八门,且缺乏统一的金标准,不同方法之间的结果常常存在差异,这让科研人员在选择合适的方法时陷入困境,严重阻碍了对三维基因组组织的深入研究。
为了攻克这一难题,来自美国 Gladstone 数据科学与生物技术研究所、加利福尼亚大学旧金山分校等机构的研究人员 Ketrin Gjoni、Laura M. Gunsalus 等人展开了一项深入研究。他们的研究成果发表在《Nature Methods》杂志上,为该领域带来了新的曙光。

研究人员主要采用了以下关键技术方法:一是利用实验获得的不同分辨率和大小的微球菌核酸酶消化染色质构象捕获(Micro-C)和高通量染色体构象捕获(Hi-C)数据;二是借助机器学习模型预测染色质接触图谱,通过对 DNA 序列进行扰动来生成多种不同的图谱;三是在计算机模拟中生成接触图谱,以模拟特定的生物学和技术变异。

研究结果如下:

  1. 多种策略评估图谱差异:研究人员对比了 25 种方法,其中包括常用的全局方法如 Spearman 相关系数(Correlation)和均方误差(MSE),以及针对染色质接触图谱特定生物学特征的接触图谱方法。通过对人类包皮成纤维细胞(HFFs)和胚胎干细胞(ESCs)的 Micro-C 接触图谱进行分析,发现 Correlation 和 MSE 在评估图谱差异时存在不一致性。例如,在某些区域,Correlation 会优先识别出具有明显结构重排和低接触频率的图谱对,而 MSE 则不会;反之,对于结构相似但接触频率范围不同的图谱对,MSE 会产生较大差异,而 Correlation 却认为它们相似。这表明在选择比较方法时,需要充分考虑不同方法对图谱差异的优先考量因素。
  2. 实验数据评估:将这些方法应用于 ESC 和 HFF 细胞系的 Micro-C 和 Hi-C 数据集。定性评估发现,不同方法对不同结构变化的敏感性不同,如 Eigenvector 对 TAD 边界和条纹差异有较好的识别能力,而 Contact Directionality 对环的变化更为敏感。在大规模定量比较中,通过聚类分析、相关性矩阵和主成分分析(PCA)发现,基于 Correlation 和 MSE 的方法往往分别聚类,且不同方法可分为两组,一组方法之间相关性较高,另一组则与其他方法相关性较差。此外,研究还发现窗口大小和实验技术会影响方法的评估结果,1-Mb 窗口在 Micro-C 和 Hi-C 之间的一致性较高,而某些方法对分辨率更为敏感。
  3. 计算机模拟扰动评估:利用机器学习模型预测的图谱,通过对 DNA 序列进行 CTCF 基序插入、删除和随机 100-bp 删除等扰动,生成大量图谱对。评估结果显示,所有方法对大的变化都较为敏感,而对小的变化不敏感。MSE-based 方法倾向于挑选出整体对比度更高的图谱。通过 PCA 和相关性分析发现,基于 TAD 和环计数的方法与其他方法的相关性最低,MSE-based 方法则单独聚类,这与实验数据的比较结果一致。
  4. 模拟量化方法敏感性和性能:通过生成模拟图谱,分别改变噪声、分辨率、对比度、强度、大小和子结构等因素,来量化每种方法对不同类型图谱变化的敏感性。结果发现,全局方法对技术变异更为敏感,而接触图谱方法则相对更稳健。例如,基于相关性的方法对对比度和强度的变化不敏感,而基于 MSE 的方法则高度敏感。此外,通过计算受试者工作特征曲线(ROC)和精确召回曲线(PR)下的面积(AUC)来评估方法的性能,发现 MSE、Triangle(mse 和 corr)、Contact Directionality(corr)和 Insulation(corr)等方法表现较好。

研究结论和讨论部分指出,没有一种 “万能” 的方法能够完美地识别染色质接触图谱中所有感兴趣的特征变化。研究人员建议,在选择方法时应充分考虑研究目的和图谱变化类型。通常,可以先使用全局方法进行初步筛选,再结合接触图谱方法对高得分的图谱对进行深入分析,同时可利用能绘制中间结果的方法进行定性分析。该研究为大规模分析染色质接触图谱提供了基础和框架,其提供的实用指南和代码库有助于科研人员进一步探索三维基因组的机制,推动该领域的发展。同时,研究也存在一定的局限性,如研究结果可能不适用于单细胞接触矩阵等情况,部分方法的参数未进行全面优化等,但这也为后续研究指明了方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号