基于3D空间坐标表征和复杂网络特征的赖氨酸乙酰化位点识别新方法3DCOOR-Kace

《Analytical Biochemistry》:3DCOOR-Kace: A 3-d Spatial Coordinates Representation Method for Lysine Acetylation Site Identification

【字体: 时间:2025年10月17日 来源:Analytical Biochemistry 2.5

编辑推荐:

  本文提出了一种基于二维张量的3D空间坐标表征方法(3DCOOR-Kace),通过融合序列和结构信息(DenseNet+SE层)显著提升赖氨酸乙酰化(Kace)位点识别性能(MCC达0.7358)。该方法突破实验限制,直接解析氨基酸空间位置,为计算生物学和功能研究提供新范式。

  
Highlight
数据集构建
Kace研究对揭示生物功能和过程至关重要。本研究基于CPLM 4.0构建了小麦(Triticum aestivum)的Kace数据集,包含6,876个实验验证的Kace位点和106,278个非Kace位点。考虑到赖氨酸乙酰转移酶(KATs)结构域通常结合多肽底物的特性,数据集设计充分覆盖功能相关序列。
理化性质分析
为更好捕捉网络信息,我们根据20种氨基酸的不同理化性质进行分类,并沿多轴旋转生成3D空间坐标。从3D网络中提取的网络衍生结构特征矩阵(STF)输入单模块DenseNet,结果显示其SN、BACC、AUC、AP和MCC指标均优于其他理化性质分类策略(详见表1),证实基于电荷性质分类的坐标构建最具生物意义。
特征分析
现有Kace识别研究多依赖序列与结构信息融合。本研究设计双分支特征提取子模块(序列信息模块+网络信息模块),基于DenseNet避免不同来源信息干扰。通过对比实验发现:序列特征(BE、PseAAC等)与网络特征(STF)组合时性能最优,而单一特征模块中网络特征贡献度显著高于传统序列特征(P<0.05)。
结论
Kace作为关键蛋白质翻译后修饰,调控众多生物过程。本研究提出的基于二维张量的3D空间坐标表征方法(Pseq)能有效构建最优复杂网络并提取全局结构特征。相比传统蛋白质接触网络(PCNs),该方法在独立测试集上MCC提升0.4261(对比MusiteDeep)和0.1660(对比TransPTM),证实其整合结构与序列信息的优越性。该框架为PTM位点识别研究提供了新思路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号