综述:机器学习工具解析健康与疾病中增强子的调控逻辑

【字体: 时间:2025年08月14日 来源:Frontiers in Genetics 2.8

编辑推荐:

  这篇综述系统阐述了深度学习(如Enformer、BPNet、DeepSTARR等模型)在解码增强子调控机制中的应用,涵盖增强子鉴定、变异影响预测、转录因子结合位点推断等方向,并探讨其在脓毒症等疾病分型和治疗中的潜力。文章整合了染色质可及性(ATAC-seq)、组蛋白修饰(H3K27ac/H3K4me1)、3D基因组(Hi-C)等多组学数据,为合成增强子设计和疾病机制研究提供了新范式。

  

1 引言

转录增强子作为DNA调控元件,通过增强子体(enhanceosome)或公告牌(billboard)模型调控基因表达的时空模式。近年单细胞技术(scRNA-seq/scATAC-seq)和空间组学揭示了增强子作用的细胞异质性,而机器学习模型正成为破解其调控密码的关键工具。

2 增强子的全基因组尺度鉴定

增强子特征包括染色质开放区域(DNaseI-seq/ATAC-seq)、激活型组蛋白标记(H3K27ac/H3K4me1)、转录因子结合(ChIP-seq)及三维互作(Hi-C)。超增强子(super-enhancer)在细胞身份维持中起核心作用。功能验证方面,STARR-seq和CRISPR干扰技术(CRISPRi)分别用于高通量增强子活性和内源位点编辑验证。

3 三维基因组与增强子通讯

拓扑关联域(TADs)和染色质环(CTCF介导)构成增强子-启动子互作框架。新提出的相分离模型认为转录因子通过固有无序区形成凝聚体激活基因,挑战了传统 looping 理论的普适性。深度学习工具如Akita和C.origami可预测3D基因组架构。

4 机器学习破解增强子调控逻辑

卷积神经网络(CNN)和Transformer架构(如Enformer)通过处理131 kbp长序列输入,显著提升变异效应预测精度。BPNet利用ChIP-exo数据解析转录因子结合位点基序,而DeepSTARR成功指导了首例合成增强子设计。模型解释工具如DeepLift可回溯关键核苷酸贡献。

5 健康与疾病中的增强子研究

在脓毒症中,单细胞多组学揭示免疫麻痹(MAGICAL算法鉴定)和巨噬细胞活化综合征相关表观遗传回路。组蛋白修饰(如H3K4me1)可能编码免疫耐受记忆,但当前缺乏大规模表观数据集制约了机器学习模型的临床应用。

6 讨论

尽管自监督模型(DNA-BERT)在跨物种迁移学习中展现潜力,但数据稀缺(如脓毒症基线组学)仍是主要瓶颈。未来需结合更精准的增强子编辑验证和跨模态数据整合,推动从机制发现到诊疗转化的突破。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号