
-
生物通官微
陪你抓住生命科技
跳动的脉搏
TCNeKP:一种用于酶催化活性预测的新型深度学习架构
《Journal of Chemical Information and Modeling》:TCNeKP: A Novel Deep Learning Architecture for Enzyme Catalytic Activity Prediction
【字体: 大 中 小 】 时间:2025年10月23日 来源:Journal of Chemical Information and Modeling 5.3
编辑推荐:
酶动力学参数(Kcat和Km)预测研究提出TCNeKP模型,通过序列嵌入、时空卷积网络、预训练SMILES编码和RBF条件编码融合特征,实现跨EC类别的参数预测。多任务模型结合注意力机制,在Kcat(R2=0.677)和Km(R2=0.657)预测中均优于现有模型。

准确预测酶动力学参数(Kcat 和 Km)对于酶的合理设计与工程研究至关重要。基于一个包含17,893个 Kcat 和24,585个 Km 数据的异构数据集,该数据集涵盖了来自7个EC类别的8911个酶序列和5023种底物,我们提出了新的TCNeKP模型来预测这些参数。在模型中,酶的序列通过时间卷积网络(TCN)模块进行自动嵌入和处理,以提取那些在初级序列中相距较远但具有催化和结合功能的残基的关键特征;底物由预训练的SMILES-Transformer语言模型进行编码;催化条件(pH值和温度)则通过径向基函数(RBF)进行编码。然后将融合后的特征输入到一个全连接网络中,以完成对 Kcat 和 Km 的单一任务预测。结果表明,TCNeKP-Kcat 和 TCNeKP-Km 模型在7个EC类别的野生型和突变型酶上均表现出稳健的性能,其预测效果优于现有的MPEK、UniKP和DLKcat模型(见表S3)。通过引入具有注意力机制的跨任务动态参数共享模块,我们进一步开发了一个多任务TCNeKP模型,该模型在 Kcat(0.677)和 Km(0.657)的预测中均取得了最高的 R2 值。这些发现表明,Kcat 和 Km 预测任务之间的协同学习能够增强酶与底物结合及催化过程的特征提取能力,从而显著提升预测性能。
生物通微信公众号
知名企业招聘