大麦表观基因组与交互组图谱揭示远端调控新机制
【字体:
大
中
小
】
时间:2025年10月12日
来源:Cell Genomics 9
编辑推荐:
本研究通过整合多组学数据,系统绘制了大麦胚胎发育和叶片组织的表观基因组图谱,利用机器学习预测了占基因组1.43%的顺式调控元件(cCREs),并通过HiChIP技术揭示了启动子-启动子互作在基因共调控中的重要作用,为作物生物工程提供了重要资源。
在植物基因组中,转录起始的调控是基因表达调控的基础层面,这一过程依赖于转录因子与顺式调控元件(CREs)之间的相互作用。随着作物生物工程的发展,CREs已成为极具潜力的研究靶点。大麦(Hordeum vulgare L.)作为最早被驯化的作物之一,因其二倍体基因组巨大(近5 Gb)而成为温带禾谷类作物的理想模型。尽管前期研究已深入分析了大麦的核心启动子,但关于近端和远端CREs的定位与功能仍知之甚少。大麦基因组拥有广阔的基因间区,这些区域很可能富含远端CREs,这为研究大型植物基因组中的转录调控机制提供了独特的机会。
此前,对面包小麦、玉米和水稻等谷物物种的全基因组表观遗传特征分析为了解CREs的一般调控潜力提供了见解,但这些分析通常使用幼苗或叶片组织,主要反映了终末分化组织中的情况。然而,顺式调控在胚胎发育过程中最为活跃,因此现有的CRE集合很可能不完整,需要扩展到包括活跃分化阶段在内的更多发育时期。远端CREs缺乏可识别的序列特征,且可能位于其靶标基因上游1 Mb之外,这使得它们的定位变得异常困难。其活性与染色质可及性、组蛋白修饰和DNA甲基化等表观遗传特征密切相关,因此整合这些标记成为注释CREs的关键策略。
为了应对这一挑战,Pavla Navratilova等研究人员在《Cell Genomics》上发表了题为“Epigenome and interactome profiling uncovers principles of distal regulation in the barley genome”的研究论文。该研究旨在全面注释大麦基因组中的CREs,并深入理解远端调控的机制。研究人员选择了一个最小的表观遗传特征集合,在大麦胚胎发育的三个阶段(授粉后8天、24天和发芽4天)以及叶片组织中生成了基因组图谱数据集,并利用HiChIP技术鉴定了激活和抑制性的基因组相互作用。
研究团队首先通过ATAC-seq、ChIP-seq和BS-seq等技术,获得了高质量的染色质可及性、组蛋白修饰(H3K4me3, H3K9ac, H3K27me3)和DNA甲基化图谱。利用ChromHMM软件整合这些数据,通过机器学习方法将基因组划分为七个染色质状态(E1-E7)。其中,状态E7被鉴定为富含活性CREs的区域,覆盖了大麦基因组的1.43%,约77,000个候选元件。为了获得高置信度的活性CRE候选集(称为“robust cCREs”),研究人员将阶段特异性的基因间ATAC-seq峰与UMRs和H3K9ac峰进行交叉比对,最终得到覆盖基因组约0.1%的元件集合。进化保守性分析和转录因子结合位点(TFBSs)富集分析进一步证实了这些预测元件的功能重要性。
为了探索活性CREs是否产生不稳定的转录信号(eRNA),研究团队在发芽4天的胚胎中进行了NET-CAGE实验。结果显示,大麦中双向和不稳定的转录本并不常见,仅在约9%的robust cCREs和3%的E7片段中检测到NET-CAGE信号,这表明eRNA转录并非大麦CREs的典型特征。
通过使用针对H3K4me3和H3K27me3的抗体进行HiChIP实验,研究人员绘制了24DAP胚胎中染色质的空间互作图谱。对互作锚点的注释揭示了多样化的基因组特征对,定义了不同的互作类型。令人惊讶的是,H3K4me3 HiChIP主要捕获了两个活性启动子之间的互作(占25.8%)以及活性启动子与E7片段之间的互作(占22.6%)。此外,约7.95%的活性启动子与内含子发生互作,5.22%与沉默的启动子互作。对互作基因对的共表达分析表明,发生互作的基因显著倾向于属于相同的表达簇,提示它们的共调控关系。
基因本体(GO)分析显示,与E7片段发生互作的基因主要编码参与形态发生、防御反应和染色质结合的转录因子(TFs),这些基因通常具有较低的组织特异性。而参与沉默启动子-E7互作的基因则与组织特异性较高的TFs相关。研究还发现了一类“二价”互作,即锚点区域同时与H3K4me3和H3K27me3 HiChIP数据集重叠,这些互作涉及处于“待命”状态的发育调控基因。
研究人员以晚期胚胎发生丰富(LEA)基因家族中的一个基因簇为例,深入探讨了表观基因组景观的动态变化及其对基因转录的影响。研究发现,位于局部互作网络中央位置的LEA_A-2基因具有最高的转录水平,其启动子区域与邻近的LEA基因启动子存在显著的互作,提示启动子间的互作可能在协调基因表达中发挥重要作用。此外,在春大麦品种Morex的Vrn3基因上游区域,研究人员成功预测了四个cCRE区域,尽管在胚胎和叶片组织中该基因不表达或表达量极低。其中,一个位于基因上游242 kb的cCRE(cCRE3)与Vrn3基因存在显著的H3K27me3关联的远程互作,且该cCRE与冬小麦中已报道的Vrn3增强子序列具有同源性,表明该区域在春大麦中可能也扮演着类似的调控角色。
本研究的关键技术方法主要包括:利用ATAC-seq分析染色质可及性;通过ChIP-seq(针对H3K4me3、H3K9ac、H3K27me3)分析组蛋白修饰;采用BS-seq分析DNA甲基化并定义未甲基化区域(UMRs);运用HiChIP技术(基于H3K4me3和H3K27me3抗体)研究三维基因组互作;利用NET-CAGE技术检测不稳定的非编码转录本;并借助ChromHMM进行染色质状态建模以预测顺式调控元件。所有分析均基于大麦品种Morex的24DAP胚胎、8DAP胚胎、4DAG胚胎以及叶片组织样本。
Profiles of epigenetic features enable the annotation of cis-regulatory elements
研究人员通过整合多个表观遗传特征的数据,利用ChromHMM机器学习方法将大麦基因组划分为七个染色质状态。其中,状态E7被鉴定为可能富含活性CREs的区域,覆盖了基因组1.43%的区域。通过将阶段特异性的基因间ATAC-seq峰与UMRs和H3K9ac峰进行交叉,定义了高置信度的“robust cCREs”集合。进化保守性分析和转录因子结合位点富集分析支持了这些预测元件的功能相关性。
Barley bidirectional and unidirectional unstable transcripts are an infrequent feature associated with cCREs
通过对4DAG胚胎进行NET-CAGE分析,研究人员发现与动物不同,大麦中典型的双向平衡eRNA转录并不常见。大多数非编码转录本表现为单向或双向不平衡的模式。仅有少量cCREs与不稳定的转录信号相关,表明增强子转录在大麦的调控中可能不占主导地位。
Histone modification-centric chromatin conformation capture detects interactions of active and silent regions
利用HiChIP技术,研究人员在24DAP胚胎中绘制了基于H3K4me3(激活)和H3K27me3(抑制)的染色质空间互作图谱。分析发现,互作距离中位数为60 kb,且一个启动子可与多个远端区域发生互作。互作在基因丰富的染色体亚端粒区域富集。
Annotation of genomic interactions determines the composition of the primary interaction classes
对HiChIP互作锚点的层次注释显示,H3K4me3介导的互作中,活性启动子-活性启动子互作和活性启动子-E7互作是主要的类型。H3K27me3介导的互作则主要包含沉默启动子与E4/E7片段的互作以及沉默启动子之间的互作。
Pairs of interacting genes tend to be co-expressed
对活性启动子-活性启动子互作基因对的共表达分析表明,发生互作的基因对显著倾向于属于相同的基因表达簇,这提示染色质环可能介导了基因的共调控。
Promoter-CRE interactions and bivalent chromatin predominantly involve genes encoding TFs
基因本体富集分析显示,与E7片段发生互作的基因显著富集在编码转录因子的基因中,这些基因通常参与发育过程且具有多效性。而涉及二价染色质互作的基因则多为处于“待命”状态的发育调控基因。
Late embryogenesis abundant genes interact and are co-regulated
对LEA_5基因簇的案例分析表明,在胚胎发育特定时期,这些基因的启动子区域之间存在显著的染色质互作。位于互作网络中心的LEA_A-2基因表现出最高的转录水平,其启动子虽然缺乏ABI5转录因子的结合位点,但可能与邻近含有该位点的LEA基因启动子发生互作,从而间接获得调控。
Regulatory elements of Vrn3 are detectable in non-expressing tissues and without vernalization treatment
在春大麦Vrn3基因的上游区域,研究人员即使在非表达组织(胚胎)和未经春化处理的情况下,也检测到了具有活性CREs表观遗传特征的区域。其中一个cCRE(cCRE3)与Vrn3启动子存在长距离的H3K27me3关联互作,且该cCRE与冬小麦中已知的Vrn3增强子具有序列相似性,表明其调控功能可能在物种间保守。
Dataset visualization in public databases enables application in barley research
所有生成的表观基因组图谱、预测的cCREs、染色质互作数据以及进化保守性信息均已整合到一个交互式基因组浏览器中,为其他研究人员利用该资源进行大麦研究提供了便利。
本研究通过整合多维表观基因组学和三维基因组学数据,首次在大麦中系统绘制了发育阶段特异性的顺式调控元件图谱和染色质互作网络。研究不仅揭示了启动子-启动子互作在基因共调控中的普遍性,还发现了二价染色质状态在发育调控基因中的存在。所预测的cCREs和互作网络为理解大型植物基因组的转录调控机制提供了新的框架,并为未来通过基因编辑等手段改良作物农艺性状奠定了坚实的基础。所有数据资源的公开共享将极大地推动大麦乃至其他禾谷类作物的基础研究和育种应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号