编辑推荐:
该综述聚焦增强子作用机制的前沿进展,探讨调控元件物理尺寸、转录因子(TFs)结合随机性、染色质结构动态及非线性过程等关键问题,解析理论模型与实验观察的矛盾,强调基因调控复杂性及创新方法的重要性。
引言
增强子是能以不依赖方向的方式调控转录的基因组序列,主要功能是在发育过程中及响应细胞外信号时,在空间和时间上调节细胞类型特异性的基因表达模式。其含有多个转录因子(TFs)结合位点,可招募不同共激活因子和共抑制因子。增强子的一个显著特性是能够跨越长达数十到数千千碱基对的基因组距离,选择性调控靶基因,且通常绕过多个不影响的其他基因,这种精准的特异性对增强子作用模型提出了明确限制。
目前解释增强子与靶启动子有效沟通以调控基因表达的机制主要有三种:稳定环化、“hit-and-run” 和相分离凝聚体模型。稳定环化和 “ hit-and-run” 模型侧重于染色质的接近性和动态变化,而凝聚体模型则强调生物物理特性和核空间组织。近期研究还提出了 “促进因子元件” 的概念,即弱或非典型增强子,可与较强增强子协同作用,支持跨中等(50–400 kb)和长基因组距离(>400 kb)的转录调控。
空间和基因组尺度视角
理解增强子功能的一大挑战在于破译其在不同空间和时间尺度上如何实现调控作用,这涉及复杂染色质和核环境中的基因表达协调,增强子活动必须克服分子噪声、拥挤和异质性以产生稳健且具环境特异性的结果。
转录因子(TFs)大小通常在 4–6 nm 之间,结合后招募的辅因子如共激活因子(p300/CBP)、染色质重塑因子(如 MLL 或 BAF 复合物)或中介体复合物等多亚基复合物,尺寸更大,可达 10–25 nm 甚至 30 nm 以上。染色质中物理距离与基因组距离呈幂律关系,即使基因组距离较短(如 5 kb)的未环化增强子 - 启动子对,平均物理距离可能达约 120 nm;而基因组距离较大(如 250 kb)的未环化对,物理距离未必如预期遥远。超级增强子等具有大基因组足迹(约 10 kb)的增强子,自身可占据约 100–150 nm 的物理体积。基于这些尺寸估计构建的增强子与启动子分子接触结构模型显示,两者实际物理距离约为 50 nm 或更大,在此距离下相关复合物可实现分子接触,但实验不确定性限制了对这种预测距离的精确检测。
动态性和随机性普遍存在
转录调控的大多数过程都具有动态性和随机性,从已充分记录的转录随机性,到转录因子在调控元件上结合的瞬时性和概率性均是如此。单分子追踪方法显示真核转录因子以高度动态方式结合靶位点,单分子测序揭示增强子处转录因子结合存在显著变异性,部分增强子仅约 15% 细胞中存在转录因子占据,而另一些则高达约 90%。单细胞成像和测序研究还发现,染色质可及性、组蛋白和 DNA 修饰、调控元件与结构元件间的三维染色质互作以及拓扑相关结构域(TADs)等高级染色质组织均呈现高度动态和异质性。
染色质相互作用的随机性不仅存在于激活或抑制环中,也延伸至拓扑相关结构域(TADs)。单细胞染色质追踪实验表明,TADs 源于高度异质结构的统计平均值,这意味着调控元件频繁、动态且混杂地接触其基因组邻近区域或因物理接近而被拉近的远隔区域,而当前增强子模型尚未解释其如何特异性区分同源和非同源靶点。
现有增强子 - 启动子接近性测量无法排除环化模型
精确测量增强子 - 启动子(EP)距离对区分环化模型和凝聚体模型至关重要,两者预测不同结果。Hi-C 的捕获半径约为 150–200 nm,而 micro-C 更小(约 50 nm),micro-C 更易检测到 EP 接触,这与环化模型预测的 EP 环化相互作用发生在约 50 nm 以下尺度一致。成像技术可直接测量单细胞数据中多对基因组位点间的全对距函数(PDF),但仪器不确定性(如多色 DNA 荧光原位杂交中的色差和连续成像中的漂移校正误差)限制了测量精度至约 50 nm,导致稳定环化模型中假定的约 27 nm 真实 EP 距离可能被测量为约 120 nm,“hit-and-run” 环化模型中的双峰值分布也因实验不确定性而难以分辨。因此,测量到的增强子与启动子之间的大距离(>200 nm)并不排除环化模型,相分离凝聚体模型则难以解释增强子如何维持激活同源启动子并避免脱靶激活的精确特异性。
非线性模型
非线性过程在增强子作用的多个层面(转录因子结合、辅因子招募、物理 EP 接近性)中起关键作用。真核转录因子识别的序列过短,需多个转录因子协同结合以增加结合亲和力和特异性,转录因子数量增加对基因表达产生强烈非线性影响,这可能源于转录因子寡聚化、蛋白质 - 蛋白质相互作用及染色质底物变化等。单分子实验表明,多个转录因子结合域的作用是招募共激活因子(如 p300)至调控位点所必需,转录因子数量与基因表达的非线性关系可能源于核小体重塑因子增加平均转录因子占据率,而非转录因子结合后的协同作用。
基因组距离与转录输出之间的关系也存在非线性,转录输出随 EP 接触频率非线性衰减,激活启动子需要多次 EP 相互作用,增强子强度影响其在增加的基因组距离上激活启动子的能力,且这种表达与 EP 距离的关系具有基因特异性。
结论
理解染色质和增强子的空间尺度、转录机制各组分的动态占据以及三维染色质接近性的随机性和混杂性,对评估增强子模型至关重要。当前 EP 接近性测量受仪器限制,未排除环化模型,纳入非线性过程的新兴模型为解释实验观察提供了有前景的替代框架。增强子作用可能涉及消耗能量的非平衡过程,如染色质重塑、组蛋白标记沉积等。未来需借助活细胞或无固定方法及多组学单分子技术,结合靶向基因扰动,进一步剖析单分子异质性并验证现有模型。