果蝇ZAD锌指蛋白家族:解码进化快、功能多样的基因组组织者

《SCIENCE ADVANCES》:Decoding the molecular logic of rapidly evolving ZAD zinc finger proteins in Drosophila

【字体: 时间:2026年03月01日 来源:SCIENCE ADVANCES 12.5

编辑推荐:

  果蝇ZAD-ZnF蛋白家族数量庞大、进化迅速,其分子多样性及体内功能尚不明确。本研究建立了一套基于CRISPR的蛋白标签系统,在果蝇活体胚胎中对内源性ZAD-ZnF的核定位和全基因组结合图谱进行了系统比较,发现N端ZAD结构域通过堆叠形成核内凝聚体,其活性对基因组结合图谱和胚胎发育至关重要。研究整合ChIP-seq和Micro-C数据,揭示了许多ZAD-ZnF与核心绝缘子蛋白CTCF、CP190等共定位,协同控制拓扑边界形成,提示其多样化功能源于其作为绝缘子结合蛋白的祖源角色。该研究为理解ZAD-ZnF如何作为基因组组织者在昆虫快速进化中发挥核心作用提供了全新见解。

  
在果蝇等昆虫的进化史上,诞生了一类数量庞大且演化迅速的蛋白质家族,它们都戴着一个共同的“帽子”——锌指蛋白关联结构域(Zinc finger–associated domain, ZAD),其后则连接着一系列能识别特定DNA序列的C2H2型锌指(zinc finger, ZnF)结构。这类被称为ZAD-ZnF的蛋白,是昆虫基因组中含量最丰富的转录因子,仅在黑腹果蝇中就有超过90个成员。然而,尽管它们数量众多,并在调控蜕皮激素合成、piRNA介导的转座子沉默乃至早期胚胎背腹轴形成中发挥着至关重要的作用,我们对这个庞大家族的整体“家底”却所知甚少。它们的成员如何在细胞核内“安家”?它们如何与基因组相互作用,又是如何通过进化快速获得新功能的?这些谜题,长期以来缺乏统一、系统的实验手段来解答。传统的研究方法,如通过固定细胞进行免疫染色,或依赖于质量不一的抗体进行染色质免疫共沉淀(ChIP),容易引入噪声,难以对内源性蛋白进行精准、直接的比较,这严重阻碍了我们全面理解ZAD-ZnF的体内功能和分子逻辑。
为了攻克这一难题,研究人员在《SCIENCE ADVANCES》发表了一项开创性的研究。他们发展并应用了一套统一的CRISPR-Cas9介导的蛋白标签系统,在活体果蝇胚胎中对内源性ZAD-ZnF和绝缘子蛋白进行了系统性、可视化的比较研究,并结合高分辨率组学技术,深入解析了它们的定位、功能与进化规律。
研究人员主要运用了以下几项关键技术:一是建立了一套CRISPR-Cas9介导的蛋白标签系统,通过在目标基因终止密码子前插入编码GFP-3xFLAG或mCherry-3xFLAG标签的序列盒,构建了一系列可遗传的基因编辑果蝇品系,用于内源性蛋白的超分辨率活体成像和ChIP-seq分析。二是利用该技术,对包括ZAD-ZnF和核心绝缘子蛋白在内的众多内源性蛋白进行了Airyscan超分辨率活体成像,直观比较了它们在早期胚胎(核周期14)中的核内定位模式。三是对这些基因编辑品系的胚胎进行了基于同一种FLAG抗体的ChIP-seq分析,获得了可相互比较的全基因组蛋白结合图谱。四是整合了已发表的果蝇胚胎Micro-C(一种高分辨率染色体构象捕获技术)数据,分析了ZAD-ZnF与基因组三维结构(如拓扑关联域边界)的关联。五是利用AlphaFold3人工智能模型预测了多个ZAD-ZnF蛋白的ZAD结构域二聚体结构。六是结合转基因拯救、基因座完全敲除、重组酶介导的盒式交换等遗传学手段,验证了ZAD结构域在特定蛋白功能中的必要性。七是对不同果蝇物种的Nnk同源基因进行了跨物种比较分析。八是对特定ZAD-ZnF敲除突变体进行了高分辨率Micro-C测序,以分析其对基因组三维结构的影响。
研究结果
Establishment of CRISPR-Cas9–mediated protein-tagging system
研究人员首先成功建立了CRISPR-Cas9介导的蛋白标签策略,以vasa和Trithorax-like (Trl)基因(编码GAGA因子,GAF)为测试案例。结果表明,该方法能够在不干扰基因功能的前提下,实现对内源性蛋白的活体可视化,并确认了GAF在胚胎中形成核内凝聚体的现象。
Visualization of endogenous insulator proteins in early embryos
研究人员对六种经典的绝缘子蛋白进行了内源性标记和活体成像。结果显示,这些蛋白在早期胚胎中表现出截然不同的核定位模式,而非共同形成统一的“绝缘子小体”,挑战了传统观点。
Systematic visualization of endogenous ZAD-ZnFs in early embryos
对14个在早期胚胎中表达的ZAD-ZnF基因进行内源性标记和成像。尽管结构相似,但它们的核定位模式差异巨大,可分为形成核内凝聚体(如Nnk, Odj, M1BP)和均匀分布(如Idc, Zif, D19B)两大类。值得注意的是,之前被认为定位于质膜的Wek蛋白,在内源性标记下显示出核内定位,暗示其功能可能被重新定义。
ZAD is required for the in vivo function of Nnk and CG30020/Brother of Nnk
以形成凝聚体的Nnk和其旁系同源基因CG30020(命名为BroN)为重点,研究发现它们N端的ZAD结构域(通过AlphaFold3预测形成二聚体)对其在体内形成凝聚体至关重要。缺失ZAD结构域(ΔZAD)的突变体无法形成凝聚体,并且不能挽救相应基因完全敲除突变体的致死表型,证明ZAD介导的凝聚对Nnk和BroN行使体内功能是必需的。
ZAD guides Nnk/BroN into H3K9me3-enriched heterochromatic regions
ChIP-seq分析显示,内源性的Nnk、BroN和Odj在全基因组范围内高度共定位,并且部分富集在富含抑制性组蛋白标记H3K9me3的异染色质区域。然而,ΔZAD的Nnk和BroN突变体选择性丢失了在H3K9me3富集区域的结合峰,表明N端ZAD引导这些蛋白与异染色质区域关联,而这种关联对胚胎发育至关重要。
Cross-species analysis of evolutionary dynamic Nnk orthologs
对来自五个不同果蝇物种的Nnk同源基因进行分析发现,与黑腹果蝇亲缘关系较近的物种(如D. simulans, D. yakuba)的同源蛋白仍能形成凝聚体并与异染色质关联,并能挽救黑腹果蝇Nnk突变体的致死性;而亲缘较远的物种(如D. ficusphila, D. persimilis)的同源蛋白则凝聚能力弱,且无法挽救致死。这表明Nnk基因在进化中发生了快速的功能分化。
ZAD-independent function of D19B during early embryogenesis
与Nnk/BroN不同,均匀分布在核内的ZAD-ZnF D19B虽然其ZAD结构域也能预测形成二聚体,但其ΔZAD突变体在核定位、基因组结合谱以及挽救D19B敲除导致的严重胚胎发育缺陷(如核分裂异常)等方面,与野生型几乎无异。这表明D19B不依赖N端ZAD发挥功能,揭示了ZAD-ZnF家族内部对ZAD结构域的依赖性存在差异。
Comparative ChIP-seq analysis of two paralogous D19A and D19B proteins
对旁系同源基因D19A和D19B的ChIP-seq分析显示,尽管两者结构高度相似,但它们在全基因组的结合位点有大量不重叠,提示它们在基因复制后发生了功能分化。D19B识别不止一种DNA基序,其ΔZAD突变体的结合谱也基本不变,进一步支持了其ZAD非依赖性。
Insulator-binding activity is a common feature of ZAD-ZnFs
整合ChIP-seq和Micro-C数据的分析揭示了一个重要发现:许多ZAD-ZnF与经典的绝缘子蛋白(如BEAF-32, CP190, CTCF)在全基因组范围内广泛共定位,并富集在关键的拓扑关联域(TAD)边界,例如Bithorax复合体Hox基因座的绝缘子元件(Fab-7, Fab-8等)。这表明绝缘子结合活性是ZAD-ZnF的一个普遍特征。
ZAD-ZnFs colocalize with known insulator proteins genome wide
进一步的基因组共定位分析证实,除了D19A/D19B等少数成员,大部分被检测的ZAD-ZnF都与BEAF-32、CP190和CTCF的ChIP-seq峰共定位。边界强度与结合该边界的蛋白数量呈正相关,暗示ZAD-ZnF与其他绝缘子蛋白的协同作用有助于建立或维持拓扑边界。
Loss of ZAD-ZnFs leads to locus-specific misregulation of TADs
通过对kipf、D19A、CG17361(命名为BEAF-25)和CG4282(命名为BEAF-75)敲除突变体进行Micro-C分析,发现缺失单个ZAD-ZnF会导致特定基因组位点的三维结构紊乱,包括原有TAD边界的消失或新的异常子TAD边界的出现。这表明单个ZAD-ZnF在特定基因座发挥塑造基因组拓扑结构的功能,但在高度共占用的强边界(如Hox基因座)处,它们可能功能冗余,从而保证了拓扑绝缘的鲁棒性。
研究结论与讨论
本研究通过建立一套创新的内源性蛋白研究体系,系统解码了果蝇ZAD-ZnF蛋白家族的分子逻辑,得出了一系列重要结论。首先,ZAD-ZnF在活体胚胎中的核定位具有高度多样性,可分为依赖ZAD形成凝聚体和不依赖ZAD均匀分布两大类。其次,N端ZAD结构域的二聚化及相分离能力对Nnk、Odj、BroN等蛋白的异染色质关联及体内存活功能至关重要,这可能驱动了它们与快速演化的异染色质区域之间的协同进化。相反,D19B等蛋白则展示了ZAD非依赖性的功能模式,体现了家族内部的功能分歧。最为关键的发现是,绝缘子结合活性是ZAD-ZnF的一个普遍且古老的特性。它们与核心绝缘子蛋白广泛共定位,共同富集于拓扑边界,参与调控三维基因组结构。单个ZAD-ZnF的缺失会导致局部TAD结构的特异性紊乱,但它们在高占用边界的功能冗余确保了关键发育基因座拓扑组织的稳定性。
这些发现具有重要意义。它们将ZAD-ZnF确立为一类具有多样化分子特性的基因组组织者,其功能可能源于其作为绝缘子结合蛋白的祖源角色,并在昆虫进化过程中经历了快速的功能分化。研究不仅挑战了关于特定成员(如Wek)亚细胞定位的传统观点,也揭示了ZAD结构域功能依赖性的多样性。此外,研究提出的统一实验框架为在体、内源地系统研究大型蛋白家族提供了强大工具。未来,探究ZAD-ZnF在不同发育阶段和组织中的功能,以及它们如何与其他蛋白互作以精确调控基因组三维结构和基因表达,将有助于我们更深入地理解昆虫发育、进化及基因组组织的普适原理。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号