
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于AI的被子植物GATA转录因子功能预测与分类系统:GATA TF Class Classifier的开发与应用
【字体: 大 中 小 】 时间:2025年09月10日 来源:BioSystems 1.9
编辑推荐:
【编辑推荐】本研究创新性地利用ProtBERT蛋白语言模型结合支持向量机(SVM),开发出准确率达94.29%的GATA转录因子(TF)分类器,突破传统系统发育分析局限,首次实现121个被子植物基因组中4170个GATA TF的功能分类(A-D类),揭示各类别在进化中的谱系特异性分布模式,为植物基因调控网络研究提供高效工具。
Highlight
功能分类系统A-D类的生物学作用
被子植物GATA转录因子根据系统发育关系分为四大功能类别(A-D类),每类均具有独特基序(如HAN/LLM)、附加结构域(如CCT或ASXH)及GATA型锌指变异(CX2CX18-20CX2C),这些特征在不同物种间高度保守。
A类成员通过IVb型锌指(CX2CX18CX2C)调控光信号与油菜素内酯通路;B类虽同为IVb型锌指,但携带HAN/LLM基序,主导植物生长与花器官发育;C类独特的IVc型锌指(CX2CX20CX2C)与TIFY/CCT结构域协同调控开花时间;D类则通过LXXLL基序参与广泛调控网络。
GATA TF分类器的功能与谱系解析
基于23个物种700条序列训练的GATA TF分类器,在121个被子植物基因组中成功预测4170个成员类别,准确率达94.29%。分析显示A/B类丰度较高,C/D类占比偏低,暗示各类别可能通过锌指微变异(如18→20个氨基酸间隔)实现功能分化。
结论
该分类器首次实现全基因组尺度GATA TF功能注释,揭示单子叶植物中A类扩张、真双子叶植物中B类优势等进化规律,为理解植物适应性进化提供新视角。AI方法克服了传统系统发育分析的长枝吸引效应,未来可拓展至其他转录因子家族研究。
生物通微信公众号
知名企业招聘