
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于图卷积网络(GCN)与网络嵌入技术的玉米/高粱/大豆根系关联蛋白预测模型Graph-Root构建
【字体: 大 中 小 】 时间:2025年07月01日 来源:Current Bioinformatics 2.4
编辑推荐:
本研究针对作物根系蛋白鉴定难题,中国研究人员开发了创新性机器学习模型Graph-Root。通过整合蛋白质序列特征(经图卷积网络GCN和多头注意力处理)、功能域及蛋白互作网络特征,首次实现了玉米、高粱和大豆根系关联蛋白的高效预测。5折交叉验证表明其性能优于传统SVM-Root模型,BLOSUM62特征被证实具有关键作用,为作物遗传改良提供了新工具。
植物根系在生长发育中扮演着不可替代的角色,其功能优化可显著提升作物产量。然而由于根系系统的复杂性,相关分子机制仍存在大量未解之谜。近年来建立的根系蛋白公共数据库为机器学习方法的应用创造了条件。
研究团队创新性地提出Graph-Root预测模型,该模型通过三大特征体系解析蛋白质特性:1)基于图卷积神经网络(Graph Convolutional Network, GCN)和多头注意力机制处理的序列特征;2)反映蛋白核心功能的功能域特征;3)表征蛋白互作关系的网络嵌入特征。这些特征经全连接层整合后,可准确预测玉米(Zea mays)、高粱(Sorghum bicolor)和大豆(Glycine max)中的根系关联蛋白。
验证实验显示,该模型在5折交叉验证和独立测试中均表现优异,其性能超越传统支持向量机模型SVM-Root。特征重要性分析揭示,BLOSUM62矩阵特征对预测结果贡献显著。这项研究不仅为作物根系研究提供了高效的计算生物学工具,其采用的GCN-网络嵌入混合策略也为其他植物性状的蛋白预测提供了新思路。
生物通微信公众号
知名企业招聘