-
生物通官微
陪你抓住生命科技
跳动的脉搏
同济大学Nature发文:DNA引导的转录因子相互作用拓展人类基因调控密码
《Nature》:DNA-guided transcription factor interactions extend human gene regulatory code
【字体: 大 中 小 】 时间:2025年04月10日 来源:Nature 50
编辑推荐:
编辑推荐:本研究通过高通量CAP-SELEX技术,系统解析了58,000余对转录因子(TF)的DNA介导相互作用,发现2,198对TF-TF复合物(包括1,131个全新复合基序),揭示了发育轴特异性调控的分子机制,解决了“Hox特异性悖论”,为理解细胞命运决定和疾病相关基因调控提供了全局性框架。
在生命科学领域,基因表达的精确调控一直是核心谜题。就像遗传密码由tRNA的解码规则定义一样,转录因子(TF)的DNA结合特异性构成了基因调控的分子基础。然而,人类基因调控密码远比遗传密码复杂——超过1,600种TF通过协同作用调控细胞特异性程序,但大多数TF结合的DNA基序高度相似,这与它们多样的生物学功能形成鲜明矛盾,例如同源域蛋白HOX1-HOX8均识别TAATTA基序却执行不同发育功能,这一现象被称为“Hox特异性悖论”。传统研究难以系统解析TF协同作用的分子机制,限制了人们对发育和疾病中基因调控的理解。
为解决这一挑战,上海同济大学等机构的研究团队在《Nature》发表了突破性研究。通过改进CAP-SELEX(连续亲和纯化系统进化配体技术)为384孔板高通量平台,该团队筛选了58,754对TF组合,首次绘制了人类TF-TF相互作用全景图。研究发现,DNA不仅作为结合模板,更通过介导TF间微小接触面(如HOXB13与TEAD4的DNA依赖型结合)大幅扩展调控词汇量。这些发现揭示了发育过程中位置信息整合的生化基础,例如神经管背腹轴特化依赖bHLH-homeodomain复合基序的精确间距,而肢体发育中GLI-RFX3复合基序通过纤毛相关机制调控Hedgehog信号通路。
关键技术包括:1) 高通量CAP-SELEX筛选TF-TF-DNA三元复合物;2) 基于互信息算法解析TF结合位点的间距/取向偏好;3) 相对亲和力模型识别全新复合基序;4) 转基因小鼠胚胎报告系统验证体内活性;5) AlphaFold 3与RoseTTAFold2NA预测TF-DNA复合物结构。
主要结果:
DNA介导的TF互作全景图:发现2,198对相互作用TF,其中1,329对显示特定间距/取向偏好(如HOXB13-MEIS1偏好5bp间隔),1,131对形成全新复合基序(如FOXI1-ELF2基序完全不同于单体结合模式)。
家族特异性互作规律:TEA家族(如TEAD4)互作最广泛,而C2H2锌指蛋白互作较少但存在关键例外(如GLI2-RFX3)。同源异型域蛋白呈现亚类特异性互作,例如HOX2亚类(HOXA2/HOXB2)专一结合PROX1/2,而PITX亚类偏好FOXA/D。
复合基序的生物学特性:89%复合基序的核心区域与单体TF结合偏好显著不同(Jaccard指数<0.5)。这些基序富集于细胞类型特异性染色质开放区域(如胰腺β细胞中bHLH-homeodomain的3bp间距基序),且在哺乳动物中进化保守(81个基序FWER<0.05)。
发育调控的分子机制:
先锋因子(如FOXA1)互作呈现“选择性社交”,而缺乏激活域的TF常通过复合物招募激活域(如HOXB2-PROX2)。
神经管背腹轴特化依赖特定复合基序组合,如腹侧中脑特异性GLI3-RFX3复合物驱动报告基因在肢芽极化活性区表达。
肢体发育增强子ZRS中发现的FOX-ETS复合基序突变可导致肢体畸形。
结构预测的局限性:AlphaFold 3能准确预测预成型二聚体(如MYC-MAX,RMSD 0.428?),但对DNA依赖型复合物(如MEIS1-DLX3)的接触面预测失败,提示当前算法仍需改进。
这项研究将已知的TF-TF互作规模扩展6倍,估计覆盖人类全部互作网络的18-47%。其意义在于:1) 提出“复合基序”作为发育调控的通用语法,通过低亲和力位点组合实现高特异性调控;2) 为疾病相关非编码突变解析提供新框架(如PROX1-HOXA2复合基序在淋巴管发育中的作用);3) 建立的CAP-SELEX数据集为AI预测基因调控提供关键训练资源。该成果标志着人类在破译“第二遗传密码”道路上迈出决定性一步。
知名企业招聘