基于三维染色质互作图谱的胰腺疾病风险增强子预测与功能验证

《Cell Genomics》:Predictive prioritization of enhancers associated with pancreatic disease risk

【字体: 时间:2025年10月17日 来源:Cell Genomics 9

编辑推荐:

  本研究针对胰腺疾病风险相关非编码变异的功能解析难题,通过构建五种原代胰腺细胞的三维增强子-启动子互作图谱,开发了基于图论树模型的机器学习算法EPIC,成功预测并实验验证了关键增强子对细胞特异性基因表达的调控作用。研究发现胰腺癌风险变异在腺泡细胞增强子中显著富集,为疾病机制研究提供了新视角,相关数据模型为胰腺疾病的变异到功能研究提供了重要资源。

  
胰腺作为人体重要的内分泌和外分泌器官,其功能障碍会导致糖尿病、胰腺炎和胰腺癌等多种疾病,全球受影响人群超过10%。尽管全基因组关联研究(GWAS)已鉴定出大量与胰腺疾病相关的遗传变异,但90%以上的风险位点位于非编码区域,其中超过80%落在增强子区域。这些增强子如何调控基因表达、在哪些细胞类型中发挥作用,以及如何影响疾病易感性,至今仍是未解之谜。
为了解决这一难题,美国国立卫生研究院国家癌症研究所的H. Efsun Arda团队在《Cell Genomics》上发表了最新研究成果。研究人员通过对28名捐赠者的胰腺组织进行分选,获得了纯度超过95%的五种原代胰腺细胞(α、β、δ细胞、腺泡细胞和导管细胞),并利用ATAC-seq和H3K27ac HiChIP技术绘制了细胞类型特异性的三维染色质互作图谱。
研究团队创新性地将染色质互作数据转化为增强子-启动子树模型,开发了机器学习算法EPIC来预测增强子对细胞特异性基因表达的影响。通过CRISPR干扰(CRISPRi)和激活(CRISPRa)技术结合单细胞RNA荧光原位杂交(RNA-FISH)验证,证实了算法预测的准确性。更重要的是,研究发现胰腺导管腺癌(PDAC)风险变异在腺泡细胞增强子中显著富集,挑战了PDAC solely起源于导管细胞的传统观点。
关键技术方法包括:通过流式细胞术分选五种原代胰腺细胞;使用ATAC-seq分析染色质可及性;采用H3K27ac HiChIP绘制三维增强子-启动子互作图谱;开发基于图论的增强子树模型和EPIC机器学习算法;通过CRISPRi/CRISPRa和单细胞RNA-FISH进行功能验证。所有人类胰腺组织均来自器官捐赠者,通过Integrated Islet Distribution Program(IIDP)等机构获取。
绘制细胞类型特异性增强子-启动子互作图谱
研究人员首先优化了胰腺细胞分选方案,从28名捐赠者中获得了高纯度的α、β、δ、腺泡和导管细胞。通过ATAC-seq和H3K27ac HiChIP技术,成功构建了37个ATAC-seq和29个HiChIP文库,平均每个样本检测到116,935个可及性区域和80,947个染色质环。在特定基因位点如GCG(α细胞)、INS(β细胞)、SST(δ细胞)、PRSS1(腺泡细胞)和CA2(导管细胞)附近,观察到了明显的细胞类型特异性互作模式。
基于图论的增强子-启动子树模型解析
研究团队将传统的成对环分析提升为网络分析方法,构建了增强子-启动子树模型。在该模型中,启动子作为根节点(P0),直接与启动子相连的增强子为E1,通过其他增强子间接连接启动子的为E2。分析发现,E1增强子占73%,L1连接占80%,表明大多数增强子直接与目标启动子形成环状结构。
有趣的是,E1增强子通常位于距离启动子更远的位置(中位距离275,552 bp),而E2增强子距离较近(中位距离149,825 bp)。更重要的是,超过80%的E1增强子会跳过最近的基因,与远端基因启动子形成互作,这些远端基因具有更高的表达特异性和转录丰度。
增强子互连性量化与森林结构发现
研究进一步分析了增强子树之间的互连性,发现了"增强子森林"结构。约90%的启动子会与其他启动子相连,而只有34%-52%的增强子连接不同的增强子树。含有细胞类型特异性基因的增强子森林表现出更多的启动子-启动子互作,这种结构可能促进细胞特异性基因的协同调控。
EPIC算法预测关键增强子
基于增强子树模型,研究团队开发了EPIC机器学习算法,利用染色质可及性(ATAC-seq)、三维互作频率(HiChIP PET计数)及其交互项等24个预测变量,评估增强子对细胞特异性基因表达的影响。通过系统性移除每个增强子节点,比较模型准确性的变化,量化每个增强子的效应大小。
单细胞水平的功能验证
为了在原代胰腺细胞中验证EPIC预测,研究人员将CRISPRi/CRISPRa与单细胞RNA-FISH技术相结合。以PCSK1和PCSK2基因为例,成功验证了预测的关键增强子。在β细胞中,针对PCSK1的顶级增强子5.3108E(EPIC效应大小0.1)进行CRISPRa操作,能显著提高PCSK1转录水平,且效果优于效应大小为0.04的5.3120E增强子。
类似地,在α细胞中针对PCSK2的三个增强子(效应大小分别为0.1、0.07和0.03)进行CRISPRa操作,发现同时靶向三个增强子会产生近乎叠加的效应,表明这些增强子在调控PCSK2表达中可能存在功能冗余。
疾病风险变异的功能注释
通过GARFIELD算法分析发现,2型糖尿病(T2D)和血糖性状相关变异在胰岛细胞增强子中显著富集,而胰腺癌风险变异在外分泌细胞增强子中富集,尤其在腺泡细胞中富集程度更高(p=1.47×10-5)。EPIC算法能够有效优先排序与疾病风险变异重叠的增强子,这些增强子在效应大小排名中显著靠前。
以XBP1基因位点为例,研究人员在腺泡细胞中鉴定出两个富含PDAC风险SNP的增强子(22.1008E和22.1015E)。CRISPRi实验证实,针对这两个增强子能显著降低XBP1在腺泡细胞中的转录水平,且降低程度与EPIC预测的效应大小一致。
研究结论与意义
该研究通过构建人类原代胰腺细胞的三维增强子-启动子互作图谱,建立了增强子-启动子树模型和EPIC机器学习算法,为理解胰腺细胞身份维持和疾病发病机制提供了新视角。研究发现直接增强子-启动子互作是基因调控的主要形式,多个增强子通过协同作用确保细胞特异性基因的稳定表达。
特别重要的是,研究挑战了胰腺癌 solely起源于导管细胞的传统观点,发现胰腺癌风险变异在腺泡细胞增强子中显著富集,支持了腺泡细胞通过腺泡-导管化生(ADM)参与肿瘤发生的新机制。此外,研究还揭示了胰腺内分泌和外分泌细胞在疾病易感性中的复杂互作关系。
这项研究不仅提供了宝贵的胰腺细胞表观基因组资源,还建立了从遗传变异到功能解析的系统框架,为未来胰腺疾病的精准医疗和靶向治疗奠定了基础。随着单细胞三维基因组技术的进步,未来有望在更高分辨率下揭示增强子动态使用的细胞异质性,进一步深化对胰腺疾病机制的理解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号