
-
生物通官微
陪你抓住生命科技
跳动的脉搏
深度学习解码G-四链体与主调控因子在组织特异性中的协同作用机制
【字体: 大 中 小 】 时间:2025年07月03日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对G-四链体(G-quadruplex, GQ)在组织特异性调控中的作用机制这一科学问题,开发了基于深度学习的DeepGQ预测框架。通过整合14种人体组织的多组学数据和EndoQuad数据库高置信度GQ图谱,研究人员首次实现了全基因组尺度组织特异性GQ预测,揭示了GQ与主调控基因(MRG)、R-loop及染色质开放区域的共定位特征。该研究为理解非经典DNA结构在基因调控中的作用提供了新范式,论文发表于《Scientific Reports》。
在生命活动的精密调控网络中,DNA的"变形记"正引发科学家们前所未有的关注。传统认知中笔直的双螺旋结构,在某些特定序列和条件下会"华丽转身"形成G-四链体(G-quadruplex, GQ)这种非经典结构。这些由富含鸟嘌呤序列折叠形成的四链结构,如同DNA分子上的"调节开关",在基因表达调控、染色质组装等关键生物学过程中扮演着重要角色。然而,这些神秘结构如何在特定组织中精确调控基因表达?它们与决定细胞命运的主调控因子(Master Regulator Genes, MRG)又如何协同工作?这些问题的答案长期笼罩在迷雾中。
来自俄罗斯高等经济大学国际生物信息学实验室的研究团队在《Scientific Reports》发表的研究给出了突破性解答。通过创新性地将深度学习技术与多组学数据融合,研究人员开发出DeepGQ预测系统,首次绘制了人类14种组织的全基因组G-四链体图谱。这项研究不仅揭示了GQ在组织特异性调控中的核心作用,更发现了其与R-loop、染色质开放区域形成调控网络的分子机制。
研究采用了多项关键技术:基于RNN-LSTM架构的深度学习模型训练(使用EndoQuad 4-6级高置信度GQ数据);整合14种组织的多组学特征(包括RNA聚合酶、组蛋白修饰、ATAC-seq和转录因子结合数据);全基因组预测验证(采用EndoQuad 1-6级数据集);组织特异性分析(通过GTEx和TissueEnrich数据库);以及功能富集分析(结合MRG结合位点和DNase超敏感位点数据)。
研究团队开发的DeepGQ模型创新性地采用RNN-LSTM架构,通过整合DNA序列信息和组织特异性组学数据,成功预测了不同组织中GQ的形成模式。模型在神经组织中的验证显示,预测结果与实验数据(EndoQuad 1-6级)的重叠率高达70-80%,其中脂肪细胞和肝脏组织的预测准确率更超过80%。这种组织特异性的预测能力为解析GQ的调控功能提供了全新工具。
通过比较14种组织的预测结果,研究人员首次区分出"核心"GQ(在所有组织中保守存在)和组织特异性GQ。引人注目的是,神经特异性GQ在EndoQuad 1-3级数据集中的数量是4-6级的两倍,这一发现揭示了实验验证的局限性——组织特异性GQ因检测次数较少而被低估。功能分析证实,神经特异性GQ富集的基因确实参与神经元发育等关键过程。
研究发现了GQ与MRG的惊人关联:在神经组织中,95%的NEUROD1结合位点相关启动子含有至少一个特异性GQ,远高于随机预期。类似模式也出现在肌肉组织(MYOD1)和肝脏组织(HNF1A)中。这种高度特异的共定位现象暗示GQ可能作为"分子平台",协助MRG建立组织特异性转录调控网络。
研究揭示了GQ形成与R-loop的密切关系:68.33%的EndoQuad 4-6级GQ与R-loop区域重叠。APOBEC3B(参与R-loop解旋)和DHX36解旋酶在GQ位点的显著富集(分别达58.81%和84.86%),为两者在调控中的协同作用提供了分子证据。神经特异性GQ与R-loop的重叠率达36.84%,进一步支持了RNA介导的GQ形成机制。
这项研究的讨论部分提出了GQ调控组织特异性的创新模型:通过形成开放染色质区域、促进增强子-启动子凝聚物形成,以及协助转录后启动子重置,GQ与MRG共同构建了细胞命运决定的调控枢纽。特别是小RNA通过形成DNA:RNA杂交体可能启动GQ形成,进而暴露MRG结合位点的假说,为理解发育编程提供了新视角。
该研究的突破性意义在于:首次建立了组织特异性GQ预测的系统方法;揭示了GQ在MRG介导的转录调控中的核心地位;提出了RNA介导的GQ动态调控模型。DeepGQ框架不仅为表观遗传调控研究提供了新工具,其揭示的GQ-MRG-R-loop调控轴更为理解发育异常和肿瘤发生等过程提供了全新视角。未来,这一平台有望助力靶向GQ的精准医疗策略开发,为相关疾病的治疗开辟新途径。
生物通微信公众号
知名企业招聘