SEgene平台:跨细胞类型解析超级增强子与基因表达关联的创新工具

【字体: 时间:2025年05月20日 来源:npj Systems Biology and Applications 3.5

编辑推荐:

  本研究针对传统超级增强子(SE)检测方法无法准确反映基因表达水平且候选SE数量庞大难以分析的局限性,开发了整合peak-to-gene links(P2GL)分析的SEgene平台。该工具通过关联ChIP-seq和RNA-seq数据,实现了SE功能活性的精准评估,在结直肠癌、胶质母细胞瘤和肺腺癌队列中成功鉴定出ERBB2等关键致癌基因的SE调控网络,为肿瘤靶向治疗提供了新思路。

  

在基因组调控领域,超级增强子(Super-Enhancer, SE)作为一类特殊的顺式调控元件,通过聚集大量转录因子和组蛋白修饰标记(如H3K27ac),能够强力驱动细胞身份基因和癌基因的表达。然而现有SE检测工具如ROSE算法存在显著缺陷:仅依赖H3K27ac信号强度,无法验证SE的实际转录活性;产生的海量候选SE难以功能注释;更关键的是,这些方法完全忽视SE与靶基因的调控关联。这些问题严重阻碍了SE在精准医疗中的应用,特别是在肿瘤靶点发现领域。

为解决这些挑战,来自日本国立癌症研究中心和千叶大学的研究团队开发了革命性的SEgene分析平台。该工具创新性地整合了ROSE算法与peak-to-gene links(P2GL)分析方法,通过关联染色质开放状态(ChIP-seq)与基因表达谱(RNA-seq),首次实现了SE功能活性的系统评估。相关研究成果发表在《npj Systems Biology and Applications》期刊。

研究采用三大关键技术:1)基于nf-core流程标准化处理ChIP-seq和RNA-seq数据;2)应用ROSE算法识别SE区域时优化缝合距离参数(12.5kb);3)开发新型P2GL算法计算±1Mbp范围内SE与基因表达的Pearson相关性,并通过随机抽样建立统计显著性阈值。所有分析均使用日本国立癌症中心肺腺癌队列、GSE156614结直肠癌和GSE145646胶质母细胞瘤等临床样本数据。

设计SE-to-gene Links分析框架
平台构建五步工作流:数据预处理→ROSE识别SE→P2GL关联分析→统计学过滤→网络可视化。在结直肠癌队列中,仅16.1%的ROSE预测SE与基因表达显著相关,验证了传统方法的低准确性。

结直肠癌数据集的应用
发现chr7:748,439-998,341区域存在SE密集簇,调控CYP2W1和ADAP1等致癌基因。GO分析显示1554个SE关联基因显著富集于Wnt/Hippo通路(p<0.001),与结直肠癌发病机制高度吻合。

网络枢纽的可视化分析
构建三层调控网络揭示:常见SE(在≥2样本中重复)通过多增强子协同调控靶基因。如chr7区SE形成网络枢纽,同时调控ADAP1和CYP2W1的表达。

胶质母细胞瘤数据集的应用
在GBM中鉴定出chr12:57,818,379-57,907,246区域的SE簇,其靶向调控GLI1和METTL1等神经发育基因,这些基因的异常激活与肿瘤干细胞特性密切相关。

肺腺癌非CAGA病例分析
在缺乏临床可操作突变的肺腺癌中,发现chr17:39,508,684-39,870,304区域存在高频SE(144个样本),强力驱动ERBB2过表达。与传统ROSE排名无关(r=0.32),证实SE功能评估必须结合表达数据。

这项研究突破了SE研究的三大瓶颈:首次建立SE功能活性的量化标准,解决ROSE假阳性率高的问题;开发不依赖Hi-C数据的关联分析方法,大幅提升临床适用性;在多种癌症中揭示SE驱动的核心致癌网络。特别是发现ERBB2在肺腺癌中受SE调控的普遍性,为靶向治疗提供新方向。

局限性在于尚未整合三维基因组数据,可能遗漏远距调控关系。未来通过纳入ATAC-seq等多组学数据,将进一步增强平台解析能力。该工具已开源(GitHub),其模块化设计支持持续升级,有望成为肿瘤表观遗传研究的标准分析流程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号