基于神经网络的V(D)J重组DNA序列特异性建模揭示RAG1/2复合物的协同作用机制

【字体: 时间:2025年06月24日 来源:Nucleic Acids Research 16.7

编辑推荐:

  本研究针对V(D)J重组过程中RSS序列选择机制不明确的问题,通过构建神经网络模型解析12-RSS中heptamer-spacer区域对重组效率的影响。研究人员利用SARP-seq高通量数据训练H4S2模型,结合SHAP解释技术首次揭示了H6-H7 dinucleotide的协同作用及非经典nonamer的全局调控效应,为理解适应性免疫多样性生成机制提供了新视角。成果发表于《Nucleic Acids Research》。

  

在适应性免疫系统的发育过程中,V(D)J重组通过将分散的V、D、J基因片段重新组合,产生具有惊人多样性的抗原受体(AgR)基因。这个被称为"免疫系统基因组工程"的过程,依赖于重组激活基因RAG1/RAG2蛋白复合物对重组信号序列(RSS)的特异性识别。然而长久以来,科学家们面临一个核心谜题:在基因组中广泛分布的半保守RSS序列中,RAG1/2复合物如何选择特定的RSS进行重组?这个选择过程直接决定了免疫受体库的多样性,但受限于RSS序列的复杂性和实验技术的局限,其分子机制始终未能完全阐明。

来自俄克拉荷马大学健康科学中心的研究团队在《Nucleic Acids Research》发表了一项突破性研究。研究人员创新性地将机器学习与生物化学相结合,通过构建神经网络模型系统解析了12-RSS中关键区域对重组效率的调控规律。这项研究不仅揭示了DNA序列特征与重组效率的定量关系,更发现了heptamer区域核苷酸间的协同作用模式,为理解V(D)J重组的分子机制提供了全新视角。

研究采用了三项关键技术方法:1)SARP-seq高通量重组效率测定技术,分析4096种12-RSS变体的重组活性;2)基于TensorFlow框架的神经网络建模,将DNA序列转化为one-hot编码输入特征;3)SHAP解释性分析技术,量化核苷酸位置的一阶和二阶相互作用。特别值得注意的是,研究人员开发了创新的协同关系向量(CRV)分析方法,可精确定位核苷酸间的协同或拮抗效应。

在"Building the H4S2 model"部分,研究团队利用SARP-seq获得的12-RSS重组效率数据,构建了预测H4-S2区域序列影响的神经网络模型。通过20折交叉验证优化后的模型表现出色,在测试集上达到0.74 FVAF值。与传统的RIC评分相比,该模型能更精细地区分活性相近但序列不同的RSS变体。模型预测与荧光报告实验验证结果高度吻合(Pearson r=0.97),证实了其可靠性。

"Melting propensity of the H4-S2 region"部分揭示了DNA热力学特性与重组效率的关联。研究发现较低的熔解温度(Tm)与较高的重组效率相关,特别是在H4-H5二核苷酸区域。通过256种4-mer序列的线性回归分析,证实RSS的构象柔性可能促进RAG1/2介导的DNA切割。这一发现为理解RSS结构动态性在重组中的作用提供了实验依据。

"SHapley Additive exPlanations-first-order interactions"部分通过SHAP分析量化了各核苷酸位置的贡献度。结果显示H6_T和H7_G具有最大的平均绝对SHAP值,表明这些位置对重组效率影响最为显著。有趣的是,H4位置未显示明显的核苷酸偏好性,这与传统认知形成对比。

研究最具创新性的发现在"Novel pairwise SHAP value comparative analysis-second-order interactions"部分。通过开发的CRV分析方法,首次揭示了heptamer区域内核苷酸间的协同作用模式。例如,H6_T和H7_G同时存在时产生正向协同效应(45° CRV),而H6_T与H7_C则表现为拮抗作用(135° CRV)。这些精细的相互作用模式解释了为何某些RSS组合能产生"超加性"重组效率。

在"Building the nonamer-informed H4S2-cNon model"部分,研究人员将模型扩展至包含nonamer信息。结果显示不同nonamer序列(CF1、Pax3、LMO2)对heptamer-spacer区域产生全局性调控,使重组效率整体上移或下移。通过KS检验发现某些heptamer核苷酸(如H6_T)的贡献受nonamer序列特异性调节,暗示存在长程相互作用。

这项研究的结论部分提出了三个重要观点:首先,heptamer-spacer区域通过三个功能模块协同调控重组效率——主导性的H6-H7二核苷酸、热力学敏感的S1-S2二核苷酸和序列依赖的H4-H5二核苷酸。其次,nonamer序列不仅产生全局效应,还与特定heptamer位置存在精细调控。最后,开发的CRV分析方法为解析DNA-蛋白质相互作用的协同效应提供了普适性工具。

该研究的科学意义体现在三个方面:1)建立了首个能准确预测RSS重组效率的定量模型,为免疫受体库形成的预测奠定了基础;2)揭示了RAG1/2识别RSS的协同作用密码,深化了对V(D)J重组分子机制的理解;3)开发的可解释AI分析方法可推广至其他DNA-蛋白质相互作用研究。这些发现不仅对免疫缺陷疾病和淋巴瘤的研究具有启示意义,也为人工设计RSS序列用于基因编辑等应用提供了理论指导。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号