利用 ipdTrimming 技术通过 6mA 足迹揭示核蛋白长程异质性组织:从单分子水平解析表观遗传动态

【字体: 时间:2025年05月23日 来源:Genome Biology 10.1

编辑推荐:

  为解决传统方法难以捕获染色质纤维上核蛋白动态互作及表观异质性问题,研究人员开发 6mA 足迹(6mA-FP)结合 SMRT CCS 的 ipdTrimming 技术,绘制核小体定位、转录因子 occupancy 及 mtDNA 长程结合事件,揭示染色质动态组织特征,为表观基因组研究提供新范式。

  

论文解读


在生命科学领域,解析基因组中核蛋白(如核小体、转录因子)的动态分布及互作机制是表观遗传学的核心挑战。传统技术如 DNase-seq、MNase-seq 等依赖核酸酶切割 DNA,仅能提供群体水平的平均信号,无法捕捉单个 DNA 分子上的异质性结合事件或长程互作模式。例如,核小体定位的动态变化、转录因子(TFs)的瞬时结合等关键信息常被掩盖。此外,线粒体 DNA(mtDNA)的核蛋白组织模式因缺乏高效解析工具而鲜少被研究。因此,开发能够在单分子水平、高分辨率揭示核蛋白长程互作的技术,成为破解表观遗传异质性的关键。

美国南加州大学(University of Southern California)的研究团队在《Genome Biology》发表研究,针对上述难题,开发了名为 ipdTrimming 的 6mA(N?- 甲基腺嘌呤) calling 新算法,并结合 6mA 足迹技术(6mA-FP)与 PacBio SMRT CCS 长读长测序,系统解析了人类细胞中核染色质及线粒体核样体的核蛋白组织特征,为表观遗传研究提供了突破性工具。

主要技术方法


研究采用以下核心技术:

  1. 6mA 足迹技术(6mA-FP):利用非特异性腺嘌呤甲基转移酶(如 M.EcoGII)对裸露 DNA 区域进行甲基化标记,结合蛋白结合区域因空间位阻形成的未甲基化足迹,通过 SMRT CCS 测序识别 6mA 位点,定位核蛋白结合区域。
  2. ipdTrimming 算法:优化 SMRT CCS 数据的动力学分析流程,通过局部修剪子读取(subread)中的异常脉冲间隔(IPD)值,提高 6mA 检测的准确性和计算效率,克服传统方法如 ipdSummary 的高计算成本问题。
  3. 单分子长读长测序:使用 PacBio Sequel 和 Revio 平台对甲基化 DNA 进行测序,获取单个 DNA 分子的长程信息,实现核蛋白结合事件的单分子分辨率分析。

研究结果


1. ipdTrimming 算法的性能突破

通过基准数据集验证,ipdTrimming 在背景噪声(如 WGA 数据集 FPR 仅 0.074%)、召回率(dam + 质粒 DNA 6mA 召回率 98.7%)和计算效率(CPU 运行时间仅为 ipdSummary 的 0.11 倍)上均显著优于现有工具(如 Fibertools、Jasmine)。其核心改进在于通过去除 IPD 异常值并优化 kmer 模型,有效提升了单分子水平 6mA 检测的可靠性,尤其适用于高 6mA 密度的 6mA-FP 数据(如人类染色质样本 FNR 低至 2.02%)。

2. 核小体动态组织的单分子解析

在体外组装的 Widom 601 核小体阵列中,6mA-FP 揭示核小体 DNA 的动态解旋模式:大部分核小体核心颗粒(147 bp)的中央 121 bp 区域(核小体二分体 ±60 bp)保持未甲基化,而末端 13 bp 区域常因组蛋白 H3 αN 螺旋和 H2A-H2B 二聚体的动态解离出现 6mA 簇。进一步分析发现,核小体解旋具有方向性偏好性,右侧(相对于二分体)解旋更频繁,与 DNA 序列中嘧啶 - 嘌呤二核苷酸的分布相关。在人类染色质中,6mA-FP 检测到核小体重复长度(NRL)的异质性,通过光谱聚类将 DNA 分子分为 5 类,其中启动子和增强子区域富集低规律性核小体排列(Class I),而着丝粒区域则呈现更规则的核小体分布,但单个 α- 卫星重复单元内仍存在显著异质性。

3. 转录因子结合的动态捕捉

以 CTCF 为模型 TF,研究发现强结合位点(ChIP-seq 高信号区域)在短甲基化(1 h)条件下呈现小于 50 bp 的 6mA 足迹,周围环绕高密度 6mA 簇,对应核小体定位边界;而长甲基化(3 h)则导致足迹消失,提示 CTCF 结合的动态性。其他关键 TF 如 SPI1/PU.1、CEBPα 等主要富集于大于 100 bp 的 6mA 簇(核小体缺失区域,NDR),其结合与活跃组蛋白标记(如 H3K4me3、H3K27ac)正相关,且与内源性 5mC 水平呈负相关,暗示 TF 结合可能伴随染色质重塑和去甲基化过程。在 rDNA 的 28S 基因座,仅部分分子存在 TF 结合相关的大 6mA 簇,揭示转录调控的单分子异质性。

4. 线粒体 DNA(mtDNA)核样体组织解析

6mA-FP 成功区分 mtDNA 与核内线粒体 DNA 片段(NUMT):mtDNA 因无核小体结构,呈现高密度 6mA 分布,而 NUMT 保留核小体周期性 6mA 模式。在 mtDNA 的 D-loop 区域,6mA 分布呈现链特异性:轻链(L 链)因单链 DNA 结合蛋白(mtSSB)保护而甲基化水平较低,重链(H 链)则因 TWINKLE 解旋酶和 POLγ 聚合酶的结合形成明确足迹。单分子分析显示,D-loop 两侧存在稳定的 POLγ 结合位点,提示线粒体复制机器的链特异性组装,这一发现无法通过传统短读长 ChIP-seq 技术实现。

结论与意义


本研究通过开发 ipdTrimming 算法与优化 6mA-FP 流程,建立了单分子水平解析核蛋白长程互作的完整技术体系。核心结论包括:

  • 方法学突破:ipdTrimming 为 SMRT CCS 数据的 6mA 分析提供了高效准确的解决方案,兼容最新 PacBio 平台(如 Revio),计算成本显著降低,推动单分子表观遗传学研究的普及。
  • 生物学发现:揭示染色质纤维上核小体动态解旋、TF 结合异质性及 mtDNA 核样体的独特组织模式,证明表观遗传异质性在基因组不同区域的普遍性,为理解基因表达调控、染色质病及线粒体功能异常提供新视角。
  • 技术应用:6mA-FP 结合长读长测序可同时检测遗传(DNA 序列)与表观遗传(6mA、5mC)信息,为解析复杂疾病(如癌症、线粒体病)中核蛋白网络的异常提供了多维度工具。

该研究不仅解决了传统技术在捕捉动态表观事件中的瓶颈,更通过单分子分辨率的 “所见即所得” 分析,重新定义了核蛋白互作研究的精度,为后续开发靶向染色质重塑机制的治疗策略奠定了方法学基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号