
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习引导的吡咯赖氨酰-tRNA合成酶进化:提升非经典氨基酸掺入效率的新策略
【字体: 大 中 小 】 时间:2025年07月20日 来源:Nature Communications 14.7
编辑推荐:
研究人员针对吡咯赖氨酰-tRNA合成酶(PylRS)催化非经典氨基酸(ncAAs)掺入效率低的问题,通过机器学习(FFT-PLSR模型)结合深度学习(ESM-1v/MutCompute/ProRefiner)定向进化其tRNA结合域(TBD),获得活性提升30.8倍的Com2-IFRS变体,并证实该突变可普适性增强6类ncAAs的蛋白表达效率,为基因密码子扩展技术提供了通用优化工具。
在合成生物学领域,将非经典氨基酸(ncAAs)精准插入蛋白质是拓展生命分子功能的关键技术。吡咯赖氨酰-tRNA合成酶(PylRS)作为该技术的核心工具,虽已成功用于300多种ncAAs的掺入,但其低催化效率导致目标蛋白产量不足,严重制约了人工蛋白质的工业化应用。传统定向进化方法需耗费大量时间筛选突变体,且易陷入局部最优解,如何系统性优化PylRS成为领域内亟待突破的瓶颈。
浙江大学的研究团队在《Nature Communications》发表创新成果,通过多层级机器学习策略对PylRS的tRNA结合域(TBD)进行智能化改造。研究首先建立FFT-PLSR(快速傅里叶变换-偏最小二乘回归)模型,从12个单点突变中预测出活性提升11倍的Com1-IFRS变体;继而整合ESM-1v、MutCompute和ProRefiner三种深度学习算法挖掘新突变位点,最终获得催化效率(kcat/KmtRNA)提升5.6倍、琥珀密码子抑制效率(SCS)增强30.8倍的Com2-IFRS变体。分子动力学模拟揭示,新突变通过重塑tRNA结合构象、缩短反应距离(3'-OH与Pyl-AMP羧基碳距离<4?的构象增加21倍)及形成新型氢键网络(如Arg193与tRNA碱基的盐桥)来增强酶活。
关键技术包括:1)构建包含38个突变体的训练集训练FFT-PLSR模型;2)采用AlphaFold3预测全长PylRS-tRNAPyl复合物结构;3)200ns分子动力学模拟分析变体构效关系;4)体外氨基酰化实验测定kcat/Km参数;5)Octet生物层干涉技术量化tRNA结合亲和力。
主要研究结果:
设计FFT-PLSR模型预测高活性组合变体
通过分析12个单点突变的 epistasis(上位性)效应,模型准确预测出D2N/R61K/H62Y等协同突变组合,实验验证Com1-IFRS(D2N/V31I/T56P/R61K/H62Y/T122S/S193R)的SCS效率提升11倍。
深度学习模型指导的进一步优化
ESM-1v、MutCompute和ProRefiner预测的D76A、K67G等新突变,经FFT-PLSR二次建模后获得Com2-IFRS(N7Y/H63L/K67N/V74W),其3-氟苯丙氨酸(3FF)掺入效率提升101.9倍,催化效率较野生型提升7.8倍。
突变体的普适性验证
将Com2突变移植至7种PylRS衍生合成酶后:
多场景应用验证
含3-甲基组氨酸(3MetH)的肌红蛋白产量提升6.3倍,催化愈创木酚氧化活性增强7.9倍;五重琥珀密码子抑制效率提高99.4倍。
这项研究不仅提供了迄今活性最高的PylRS变体库,更开创了机器学习驱动tRNA合成酶优化的新范式。通过解构TBD与催化域(CD)的协同进化机制,为设计正交遗传密码系统奠定了理论基础。特别值得注意的是,Com2突变对异源嵌合合成酶(如将PylRS-TBD与组氨酰-tRNA合成酶CD融合的chHisRS)同样有效,展现出跨越酶类的普适性优化能力,为人工生命元件的标准化设计提供了关键技术支持。
生物通微信公众号
知名企业招聘