
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于全基因组染色质状态建模揭示人类表观遗传变异的跨个体全局模式及其在复杂疾病中的调控机制
【字体: 大 中 小 】 时间:2025年06月08日 来源:Communications Biology 5.2
编辑推荐:
本研究通过开发堆叠式ChromHMM模型,系统解析了淋巴母细胞系(LCL)和自闭症谱系障碍(ASD)前额叶皮层组织中H3K27ac/H3K4me1/H3K4me3的跨个体表观遗传变异全局模式,发现其与基因表达、转录因子(TF)活性及疾病状态显著相关,为解析复杂性状的trans调控机制提供了新范式。
人类基因组中表观遗传变异的系统性研究近年来取得重要进展,但传统方法主要关注单个位点的变异,忽略了跨基因组区域的协同调控模式。这种局限性阻碍了对复杂性状背后分子机制的理解,特别是在基因表达调控中起关键作用的trans调控因子(即能远程调控多个基因的蛋白质)的鉴定。由于trans调控涉及大量关联测试,统计效能较低,亟需开发新方法来系统捕捉表观遗传变异的全局特征。
针对这一挑战,加州大学洛杉矶分校的研究团队创新性地采用堆叠式ChromHMM模型,首次在全基因组尺度上解析了人类表观遗传变异的跨个体重复模式。该研究通过对淋巴母细胞系(LCL)的三种组蛋白修饰(H3K27ac、H3K4me1和H3K4me3)及自闭症谱系障碍(ASD)患者前额叶皮层组织的H3K27ac数据进行建模,揭示了这些全局模式与基因表达、遗传变异和疾病状态的关联,相关成果发表在《Communications Biology》。
研究主要采用三大关键技术:1)基于75例LCL和76例ASD队列的组蛋白修饰ChIP-seq数据,通过堆叠式隐马尔可夫模型(HMM)学习跨个体表观遗传变异模式;2)开发全局模式定量性状位点(gQTL)分析方法,将变异模式与遗传多态性关联;3)整合基因表达、蛋白质组学和转录因子(TF) motif富集等多组学数据验证生物学意义。
在"Systematic genomic annotation of chromatin variation across individuals"部分,研究团队建立了200bp分辨率的全基因组注释体系,发现85个LCL全局模式中62.5%与增强子/启动子状态相关。通过"Learning global patterns in LCLs"分析,证实不同组蛋白修饰的发射参数在相同全局模式下高度相关(Spearman相关系数>0.5),表明模型捕获了真实的生物学信号。
"Common genetic variation associated with LCL global patterns"揭示2945个gQTLs显著富集于免疫相关通路(如"淋巴细胞活化调控"),且与表达数量性状位点(eQTL)存在显著重叠(p<0.001)。在"LCL global patterns enriched for active regions of the genome"中,全局模式与CpG岛、DNase I超敏感位点等调控元件高度重叠,并富集4950个自身免疫疾病GWAS变异。
研究团队在"Predicting trans-regulators in LCL"中创新性地将全局模式与TF调控网络关联,鉴定出79个TF的motif显著富集(FDR<5%),其中24个TF的表达与特定全局模式共变。典型案例包括:1)TP73 motif富集的增强子样模式同时关联其自身表达,该基因已知调控辅助T细胞分化相关基因;2)CREB5家族TF在活跃转录起始位点(TSS)相关模式中富集,参与免疫基因调控。
针对ASD队列的"Learning global patterns across ASD cases and controls"分析发现,90个全局模式中27个显著富集神经发育相关TF motif(如RFX家族)。通过"Association of global patterns with ASD status"鉴定出两个启动子样模式(47和49号)与ASD诊断显著相关(padj
<0.05),其中49号模式关联的316个基因富集于"白细胞介素-1响应"等通路,为ASD的免疫失调假说提供了表观遗传证据。
这项研究建立了表观遗传变异全局模式分析的新范式,其重要意义体现在三方面:1)技术层面开发的堆叠式ChromHMM模型克服了传统单一位点分析的局限性;2)生物学层面揭示了trans调控网络的分子基础,如TP73和CREB5等TF的跨基因组协同调控;3)医学层面为ASD等复杂疾病提供了新的表观遗传标记。研究者强调该方法可推广至其他细胞类型和表观数据类型,为解析复杂性状的分子机制开辟了新途径。
生物通微信公众号
知名企业招聘