条件深度学习模型揭示氨基酸剥夺下翻译延伸动力学的密码

《Communications Biology》:Conditional deep learning model reveals translation elongation determinants during amino acid deprivation

【字体: 时间:2025年11月28日 来源:Communications Biology 5.1

编辑推荐:

  本研究针对氨基酸剥夺条件下翻译延伸调控机制不清的问题,开发了名为Riboclette的条件双头深度学习模型,能够基于mRNA序列精准预测六种氨基酸剥夺条件下的核糖体足迹谱。通过可解释AI技术,研究揭示了特定剥夺相关密码子、多碱性区域和带负电氨基酸是核糖体停滞的主要驱动因素,并成功提取了具有位置特异性的停滞诱导模体。该框架为理解翻译延伸的基因内异质性提供了新工具,对代谢疾病机制研究具有重要启示。

  
在细胞生命活动中,蛋白质翻译是基因表达调控的核心环节,而翻译延伸过程作为蛋白质合成的重要阶段,近年来被发现与多种代谢疾病和癌症发生发展密切相关。当细胞面临氨基酸匮乏等营养压力时,核糖体在mRNA上的行进会发生变化,但这种动态调控的具体机制,特别是在高等真核生物中,仍然存在大量未知。传统研究多关注翻译起始的调控,而延伸阶段的精细调控犹如一个"黑箱",其内部运作规律亟待揭示。
随着核糖体图谱技术(Ribo-seq)的发展,科研人员能够获得全基因组水平的核糖体足迹数据,为解析翻译延伸动力学提供了前所未有的机会。然而,这些数据存在显著噪声和大量缺失值,且不同氨基酸剥夺条件下的特异性响应模式难以通过常规分析方法捕捉。更关键的是,翻译延伸表现出高度的基因内异质性——同一基因不同位置的核糖体行进速度可能存在巨大差异,这种复杂性对计算建模提出了严峻挑战。
为了解决这些难题,洛桑联邦理工学院(EPFL)的研究团队在《Communications Biology》上发表了最新研究成果。他们开发了名为Riboclette的条件深度学习框架,首次实现了多氨基酸剥夺条件下翻译延伸动力学的精准预测和机制解析。
研究团队创新性地设计了双头架构模型,其中一个头预测正常条件下的核糖体足迹谱(RFP),另一个头专门预测剥夺条件与正常条件的差异(ΔRFP)。这种设计巧妙地将技术偏差与生物学信号分离,使模型能够专注于氨基酸剥夺特有的调控效应。模型以mRNA编码序列(CDS)为输入,通过Transformer或BiLSTM架构处理,最终输出六种条件(亮氨酸、异亮氨酸、缬氨酸单剥夺及其组合剥夺)的核糖体分布预测。
在方法学上,研究团队整合了来自小鼠肝脏和成纤维细胞的两个Ribo-seq数据集,包含正常和五种氨基酸剥夺条件。通过严格的质控和过滤,构建了高质量的训练、验证和测试集。模型采用基于皮尔逊相关系数的多任务损失函数进行优化,并创新性地应用伪标签技术提升数据质量。此外,研究还采用了集成梯度算法进行特征归因分析,并通过束搜索策略进行模体提取,以揭示密码子间的相互作用效应。
Transformer-based Riboclette is the best performing model across conditions
研究表明,基于Transformer的Riboclette模型在所有条件下均表现最优,宏平均PCC达到0.633±0.006,显著优于RiboMIMO、Riboformer和Ixnos等基线模型。伪标签技术的引入进一步提升了模型性能,特别是在处理不同细胞类型和实验方法产生的技术变异方面表现出强大鲁棒性。值得注意的是,模型在缬氨酸剥夺条件下预测性能最高,这与该条件诱导最强停滞效应的生物学观察一致。
Riboclette predictions are primarily affected by adjacent codons
通过集成梯度分析发现,核糖体A位点预测主要受其附近10个密码子窗口内(特别是-5至+4位置)的序列环境影响。在正常条件下,模型检测到-5和+3位置存在技术偏差,而在剥夺条件下,归因分布更加"干净",主要反映了生物学信号。这一发现验证了模型双头设计在分离技术噪声方面的有效性。
Riboclette attributions identify deprivation-specific codons affecting ribosome stalling
密码子水平归因分析揭示了各条件下的特异性停滞密码子:正常条件下,带负电氨基酸(谷氨酸GAA、天冬氨酸GAT/GAC)和多碱性区域(赖氨酸AAA/AAG、精氨酸AGA/CGA)是主要慢速密码子;而在剥夺条件下,模型准确识别了相应的剥夺相关密码子——异亮氨酸(ATC/ATT)、缬氨酸(GTC/GTT)和亮氨酸(CTC/CTT/TTG)。值得注意的是,缬氨酸剥夺效应最强,亮氨酸最弱,这一发现与独立研究结果相互印证。
Riboclette perturbation analysis reveals codon motifs for ribosome stalling
通过体外扰动实验,研究团队提取了诱导核糖体停滞的密码子模体。在正常条件下,长度1的模体主要包含天冬氨酸、谷氨酸等带负电氨基酸;而在氨基酸剥夺条件下,出现了更长的特异性模体,如异亮氨酸剥夺中的ATC-[SKIP]-ATC模体。这些模体在核糖体足迹峰值区域显著富集,且发现亮氨酸和异亮氨酸模体具有长程效应,可影响至A位点上游9个密码子位置。
Codon motifs help explain position-specific ribosome stalling
通过Col1a2、Psmd3和Col6a1基因的案例研究,展示了Riboclette在解析基因特异性停滞模式方面的应用价值。研究发现,连续剥夺密码子的出现会产生"斜坡效应",导致核糖体累积和停滞增强。模型生成的归因图谱与提取的模体相互印证,为位置特异性停滞提供了机制性解释。
该研究的意义不仅在于开发了一个高性能预测工具,更在于建立了从序列到功能的可解释框架。Riboclette能够识别传统方法难以发现的稀有停滞事件决定因子,为理解翻译延伸调控提供了新视角。在应用层面,该框架可用于mRNA序列优化、疾病相关突变效应评估以及营养应激响应机制解析。尽管当前模型仅针对六种剥夺条件,但其方法论为构建更通用的翻译调控模型奠定了基础。未来,通过整合多组学数据和扩展物种范围,这类模型有望在精准医学和合成生物学领域发挥重要作用。
研究证实,氨基酸剥夺通过特异性密码子偏好性和模体效应精细调控翻译延伸速率,而Riboclette框架成功捕捉了这些复杂规律。该工作为系统解析翻译延伸调控网络提供了新范式,对理解代谢疾病机理和开发靶向治疗策略具有重要推进作用。随着更多高质量数据的积累和模型能力的扩展,这类计算方法有望成为连接序列变异与表型效应的桥梁,最终实现翻译调控的精准预测与干预。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号