QuickProt:基于同源性的快速蛋白质注释工具推动非模式生物比较基因组学发展

《Molecular Ecology Resources》:QuickProt: A Fast and Accurate Homology-Based Protein Annotation Tool for Non-Model Organisms to Advance Comparative Genomics

【字体: 时间:2026年01月13日 来源:Molecular Ecology Resources 5.5

编辑推荐:

  本文推荐一款名为QuickProt的新型同源蛋白质注释工具,它通过简化流程(仅需同源比对、伪转录本构建和编码区提取三步)实现快速、精准的基因组注释。该工具在非模式生物(如石斑鱼、四倍体爪蟾、芸香科植物)中展现出高效性,支持系统发育重建、直系同源基因识别及功能基因挖掘,为大规模比较基因组学研究提供低成本、高可靠性的解决方案。

  
1 引言
随着基因组测序技术的快速发展,测序基因组数量急剧增长,但截至2025年3月,仅约18%的真核生物基因组完成基因模型注释。注释缺口成为比较基因组学发展的主要障碍,尤其对于缺乏转录组数据的非模式物种。现有注释工具(如BRAKER2、GALBA)存在计算资源需求大、过度拟合风险高等问题。QuickProt应运而生,其通过同源蛋白质比对、伪转录本构建和编码区提取三步流程,避免复杂模型训练,显著提升注释效率与特异性。
2 材料与方法
2.1 数据收集与预处理
研究收集了动物(石斑鱼亚科、爪蟾属)和植物(芸香科)的基因组与蛋白质数据,使用get_longest_transcript_gff3.py脚本保留每个基因的最长异构体。
2.2 性能评估
以缺乏转录组数据的褐石斑鱼(Epinephelus bruneus)为测试对象,对比QuickProt、BRAKER2和GALBA的运行时、基因数量、外显子分布等指标,并通过GffCompare计算灵敏度与特异性。
2.3 功能注释与重复元件分析
使用DIAMOND比对NR、KEGG和SwissProt数据库,结合RepeatModeler和RepeatMasker识别转座元件(TE)。
2.4 基因完整性评估
通过BUSCO(compleasm)评估基因模型完整性。
2.5-2.10 比较基因组学应用
包括石斑鱼亚科系统发育重建、水平基因转移(HGT)事件探测、爪蟾多倍体基因组注释、芸香科核心基因识别及分化时间估计等。
3 结果
3.1 QuickProt算法概述
工具分三步:①Miniprot比对同源蛋白质至基因组;②TransDecoder预测编码区;③基于长度和得分过滤低质量基因模型。其优势在于通过“标记”保守编码区快速构建非冗余基因模型,但依赖高质量同源蛋白质输入。
3.2 褐石斑鱼基因组注释性能
QuickProt预测26,046个基因,显著低于BRAKER2(55,940)和GALBA(39,395),且单外显子基因比例更低,基因长度分布更接近近缘物种。运行时较BRAKER2和GALBA分别快1098分钟和1276分钟。BUSCO完整性达89.09%,虽略低于对比工具,但兼顾速度与准确性。
3.3 模式生物基准测试
在拟南芥、线虫、果狗、河豚四物种中,QuickProt特异性最高,F1分数与主流工具相当,且运行时大幅缩短。
3.4 案例研究1:石斑鱼亚科比较基因组学
系统发育树显示褐石斑鱼与云纹石斑鱼亲缘最近,共线性分析揭示二者间21,117个共线基因。此外,发现一个潜在HGT事件:褐石斑鱼中识别含RVT1结构域的蛋白簇,其编码基因嵌入LINE/L2转座子,密码子使用偏好(RSCU)与弧菌(Vibrio)相似,提示转座子介导的HGT。
3.5 案例研究2:多倍体物种应用
在四倍体爪蟾中,QuickProt预测基因数(X. petersii: 37,705)更合理,避免BRAKER2等的过度预测。系统发育与共线性分析揭示L/S亚基因组不对称演化,S亚基因组基因丢失更多。
3.6 案例研究3:芸香科比较基因组学
注释11个芸香科物种(基因数23,303–41,083),系统发育树支持杂交种(如甜橙为柚与橘杂交后代)。核心基因家族(9,169个)富集于蛋白酶体、N-聚糖合成等通路,并识别出油脂代谢关键基因(如LPAT2MYC5)。
4 讨论
QuickProt在非模式生物中实现快速、精准注释,但其依赖同源序列且无法预测新基因。随着蛋白质数据库扩张,其在大规模比较基因组学中价值将进一步提升。案例应用显示其能支持系统发育重建、HGT探测、多倍体演化分析等,为生命之树研究提供高效工具。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号