
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人类蛋白质组计划目标列表中PE5条目的重新评估与升级策略研究
【字体: 大 中 小 】 时间:2025年07月01日 来源:Journal of Proteome Research 3.8
编辑推荐:
为解决HUPO-HPP目标列表中76个PE5(存在性质存疑)蛋白编码基因的归类争议,研究人员通过整合文献、参考数据库及跨物种基因组比对证据,系统评估其蛋白质存在可信度。结果显示:17个条目应升级为PE1(实验证据确凿),15个保留转录证据但缺乏翻译证据,41个需进一步验证,仅3个维持PE5分类。该研究为HPP目标清单的精准构建提供了关键决策依据。
在探索生命奥秘的征程中,人类蛋白质组宛如一部尚未完全破译的密码本。国际人类蛋白质组组织(HUPO)发起的"人类蛋白质组计划"(Human Proteome Project, HPP)旨在为所有19,433个蛋白编码基因提供高可信度的翻译证据。然而,当前UniProtKB数据库(2024_06版)中仍有76个基因被标注为PE5(Protein Existence level 5),意味着专业人工审阅者对这些基因能否真正编码蛋白质持怀疑态度。这些"身份存疑"的基因就像蛋白质世界里的"灰色地带",它们是否应该继续留在HPP的目标清单中?这个问题直接关系到人类蛋白质组研究的完整性和准确性。
为解开这个科学谜团,研究人员开展了一项系统性评估研究。通过整合多维度证据链:包括全面检索已发表文献、分析参考数据库记录,以及进行跨物种基因组比对,团队对这76个PE5条目进行了"基因身份核查"。研究结果发表在《Journal of Proteome Research》上,为HPP目标清单的优化提供了重要决策依据。
关键技术方法包括:1)文献证据挖掘系统(覆盖PubMed等数据库);2)多物种基因组保守性分析(基于Ensembl-GENCODE注释);3)UniProtKB数据库PE分级标准应用;4)转录组数据与蛋白质组数据的交叉验证。
【证据等级重新划分】
通过整合实验证据发现,17个原PE5条目存在明确质谱检测或抗体验证数据,符合PE1(实验证据确凿)标准。例如基因X的多个独立研究均报道其蛋白质产物检测结果。
【转录证据支持组】
15个基因虽缺乏直接翻译证据,但具备:1)RNA-seq检测到的转录本;2)跨物种保守的开放阅读框;3)典型蛋白编码基因进化特征,提示可能为功能性基因。
【证据不足保留组】
41个条目既无翻译也无转录证据,但基因组特征仍保持蛋白编码基因的进化印记。这类"基因化石"的保留与否涉及数据库管理政策考量。
【维持PE5排除组】
仅3个条目经全面评估后仍最适合保留PE5分类,建议从HPP目标列表中移除,如基因Y在多个哺乳动物谱系中均出现阅读框破坏突变。
这项研究的意义在于首次系统解决了HPP目标列表中PE5条目的分类争议。通过建立多证据评估框架,将76%的原PE5条目(59个)重新归类为潜在功能性基因,极大丰富了人类蛋白质组的研究范围。特别是17个升级为PE1的条目,为后续功能研究提供了明确靶点。研究还提出了"进化印记保留但缺乏表达证据"这类特殊基因的处理建议,为国际蛋白质数据库的注释标准完善提供了重要参考。论文强调,随着检测技术进步,部分当前归类可能需要重新评估,建议建立PE状态的动态更新机制。
生物通微信公众号
知名企业招聘