基于AI的被子植物GATA转录因子功能预测与分类系统:GATA TF Class Classifier的开发与应用

【字体: 时间:2025年09月10日 来源:BioSystems 1.9

编辑推荐:

  【编辑推荐】本研究创新性地利用ProtBERT蛋白语言模型结合支持向量机(SVM),开发出准确率达94.29%的GATA转录因子(TF)分类器,突破传统系统发育分析局限,首次实现121个被子植物基因组中4170个GATA TF的功能分类(A-D类),揭示各类别在进化中的谱系特异性分布模式,为植物基因调控网络研究提供高效工具。

  

Highlight

功能分类系统A-D类的生物学作用

被子植物GATA转录因子根据系统发育关系分为四大功能类别(A-D类),每类均具有独特基序(如HAN/LLM)、附加结构域(如CCT或ASXH)及GATA型锌指变异(CX2CX18-20CX2C),这些特征在不同物种间高度保守。

A类成员通过IVb型锌指(CX2CX18CX2C)调控光信号与油菜素内酯通路;B类虽同为IVb型锌指,但携带HAN/LLM基序,主导植物生长与花器官发育;C类独特的IVc型锌指(CX2CX20CX2C)与TIFY/CCT结构域协同调控开花时间;D类则通过LXXLL基序参与广泛调控网络。

GATA TF分类器的功能与谱系解析

基于23个物种700条序列训练的GATA TF分类器,在121个被子植物基因组中成功预测4170个成员类别,准确率达94.29%。分析显示A/B类丰度较高,C/D类占比偏低,暗示各类别可能通过锌指微变异(如18→20个氨基酸间隔)实现功能分化。

结论

该分类器首次实现全基因组尺度GATA TF功能注释,揭示单子叶植物中A类扩张、真双子叶植物中B类优势等进化规律,为理解植物适应性进化提供新视角。AI方法克服了传统系统发育分析的长枝吸引效应,未来可拓展至其他转录因子家族研究。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号