
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:机器学习工具解析健康与疾病中增强子的调控逻辑
【字体: 大 中 小 】 时间:2025年08月14日 来源:Frontiers in Genetics 2.8
编辑推荐:
这篇综述系统阐述了深度学习(如Enformer、BPNet、DeepSTARR等模型)在解码增强子调控机制中的应用,涵盖增强子鉴定、变异影响预测、转录因子结合位点推断等方向,并探讨其在脓毒症等疾病分型和治疗中的潜力。文章整合了染色质可及性(ATAC-seq)、组蛋白修饰(H3K27ac/H3K4me1)、3D基因组(Hi-C)等多组学数据,为合成增强子设计和疾病机制研究提供了新范式。
转录增强子作为DNA调控元件,通过增强子体(enhanceosome)或公告牌(billboard)模型调控基因表达的时空模式。近年单细胞技术(scRNA-seq/scATAC-seq)和空间组学揭示了增强子作用的细胞异质性,而机器学习模型正成为破解其调控密码的关键工具。
增强子特征包括染色质开放区域(DNaseI-seq/ATAC-seq)、激活型组蛋白标记(H3K27ac/H3K4me1)、转录因子结合(ChIP-seq)及三维互作(Hi-C)。超增强子(super-enhancer)在细胞身份维持中起核心作用。功能验证方面,STARR-seq和CRISPR干扰技术(CRISPRi)分别用于高通量增强子活性和内源位点编辑验证。
拓扑关联域(TADs)和染色质环(CTCF介导)构成增强子-启动子互作框架。新提出的相分离模型认为转录因子通过固有无序区形成凝聚体激活基因,挑战了传统 looping 理论的普适性。深度学习工具如Akita和C.origami可预测3D基因组架构。
卷积神经网络(CNN)和Transformer架构(如Enformer)通过处理131 kbp长序列输入,显著提升变异效应预测精度。BPNet利用ChIP-exo数据解析转录因子结合位点基序,而DeepSTARR成功指导了首例合成增强子设计。模型解释工具如DeepLift可回溯关键核苷酸贡献。
在脓毒症中,单细胞多组学揭示免疫麻痹(MAGICAL算法鉴定)和巨噬细胞活化综合征相关表观遗传回路。组蛋白修饰(如H3K4me1)可能编码免疫耐受记忆,但当前缺乏大规模表观数据集制约了机器学习模型的临床应用。
尽管自监督模型(DNA-BERT)在跨物种迁移学习中展现潜力,但数据稀缺(如脓毒症基线组学)仍是主要瓶颈。未来需结合更精准的增强子编辑验证和跨模态数据整合,推动从机制发现到诊疗转化的突破。
生物通微信公众号
知名企业招聘