基于深度学习的酶最佳pH值预测及点突变设计以提高酸耐受性
《ACS Synthetic Biology》:Deep Learning-Based Prediction of Enzyme Optimal pH and Design of Point Mutations to Improve Acid Resistance
【字体:
大
中
小
】
时间:2025年11月24日
来源:ACS Synthetic Biology 3.9
编辑推荐:
CatOpt是一种基于深度学习的酶最适pH预测模型,结合ESM-2嵌入、多尺度CNN和多头自注意力机制,显著优于现有模型(RMSE=0.833,R2=0.479),并可通过注意力权重解释关键氨基酸残基。实验验证其指导的点突变设计可有效提升Pyrococcus horikoshii二乙酰齐多巴糖酶在酸性条件(pH4.5/5.5)的活性约7%。
在合成生物学快速发展的背景下,酶作为生物催化剂,在工业应用中发挥着至关重要的作用。从食品发酵到废物转化,再到绿色生物制造,酶的性能直接影响了生产效率和环境友好性。然而,酶的催化活性受到多种因素的影响,其中pH值是一个关键变量。因此,准确预测酶的最佳pH值(pHopt)对于酶的筛选、工程改造以及在特定环境下的应用具有重要意义。传统的酶活性实验通常需要大量的时间和资源,难以满足快速筛选的需求。为了解决这一问题,研究者们开发了多种基于机器学习的预测方法,但这些方法往往只能预测酶的pH偏好范围(如酸性或碱性偏好),而无法提供具体的pHopt数值。此外,许多现有模型缺乏对关键序列信息的解释能力,限制了其在酶设计中的应用。
为应对上述挑战,本研究提出了一种新的深度学习模型——CatOpt,该模型能够从蛋白质序列中直接预测酶的最佳pH值,并提供对关键序列信息的可解释性。CatOpt结合了预训练的蛋白质语言模型(如ESM-2)、多尺度卷积神经网络(CNN)、多头自注意力机制以及残差密集神经网络(DenseNet)等技术。通过这些组件的协同作用,CatOpt不仅实现了较高的预测精度,还能够识别哪些氨基酸残基对酶的pH偏好起关键作用。在实验验证中,CatOpt在测试集上的预测准确度达到了R2 = 0.479,均方根误差(RMSE)为0.833,显著优于现有的预测模型,如Seq2pHopt、EpHod和OphPred。这一结果表明,CatOpt在酶pH偏好预测方面具有更高的可靠性。
除了预测精度,CatOpt还具备良好的可解释性。通过分析残差注意力权重,研究人员能够识别出对酶pH偏好起重要作用的氨基酸残基。这种解释能力对于理解酶的结构-功能关系至关重要,因为它可以帮助科学家识别哪些残基在特定pH条件下对催化活性产生显著影响。例如,在酸性偏好酶和中性偏好酶之间,CatOpt能够区分出不同类型的残基(如酸性、碱性、极性和非极性残基)的注意力权重分布,从而揭示了这些残基在酶催化过程中的角色。此外,模型还能够识别出与底物结合位点和催化活性相关的残基,为酶的工程设计提供了理论依据。
在实际应用方面,CatOpt展示了其在酶工程中的潜力。研究人员利用该模型设计了一种单点突变,以增强来自*Pyrococcus horikoshii*的二乙酰基壳二糖苷脱乙酰酶(PhDac)在低pH条件下的催化活性。PhDac用于绿色制造葡萄糖胺(GlcN),其在酸性环境中的活性对于工业应用尤为重要。实验结果表明,通过CatOpt指导设计的突变(如H44C和H44D)使PhDac在pH = 4.5和5.5下的活性提高了约7%。这一成果不仅验证了CatOpt在酶工程中的有效性,也表明其可以作为一种有效的工具,用于设计具有特定pH偏好的酶。
此外,CatOpt在预测点突变对酶pH偏好的影响方面也表现出色。通过对多种酶(如PhDac、BCX、TanBlp和CRZHD)的突变体进行预测,研究人员发现CatOpt能够较为准确地判断突变对酶pH偏好的影响方向。例如,对于PhDac的某些突变,CatOpt预测了pHopt的下降趋势,而对另一些突变则预测了pHopt的上升趋势。这些预测结果与实验数据基本吻合,尽管在某些情况下,数值上的差异仍需进一步验证。通过这种预测能力,CatOpt为酶的理性设计提供了支持,使科学家能够在不进行大量实验的情况下,快速筛选出可能具有理想pH偏好的突变体。
然而,尽管CatOpt在多个方面表现出色,其仍存在一些局限性。首先,训练数据集的不平衡可能影响模型的预测性能。例如,在预测低pH(pHopt < 6)和高pH(pHopt > 8)的酶时,模型的精度相对较低。因此,通过增加这些pH范围的实验数据,可以进一步提升CatOpt的预测能力。其次,CatOpt目前未能充分考虑环境因素(如温度和离子强度)对酶pH偏好的影响。这些因素可能会影响蛋白质的构象变化,从而间接改变酶的催化活性。因此,未来的研究可以结合更多的实验数据,以更好地理解环境条件与酶性能之间的复杂关系。
最后,CatOpt在识别微生物的pH偏好方面也存在一定的挑战。尽管模型能够区分酸性偏好和碱性偏好酶,但在区分中性偏好和酸性偏好微生物时,其表现不够理想。这可能是因为中性偏好微生物中的酶pHopt范围与酸性偏好微生物中的酶pHopt范围存在重叠。因此,需要进一步研究微生物生长环境与酶pH偏好的关系,以提高CatOpt在微生物分类中的准确性。
总体而言,CatOpt作为一种新的深度学习模型,不仅在预测酶的最佳pH值方面表现出色,还具备良好的可解释性,为酶的筛选和工程设计提供了有力的工具。尽管仍存在一些局限性,但其在合成生物学领域的应用前景广阔,有望加速新型酶的发现和优化过程。未来的研究可以进一步完善CatOpt的模型结构,增加训练数据的多样性,并探索其在其他蛋白质功能预测任务中的潜力,从而推动酶科学和生物技术的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号