综述:在基因组规模的代谢模型中生成基因-蛋白质-反应关联规则:发展历程、面临的挑战及未来展望

《Biochemical Engineering Journal》:Generation of Gene-Protein-Reaction Association Rules in Genome Scale Metabolic Models: Chronology, Challenges, and Future Perspectives

【字体: 时间:2025年11月26日 来源:Biochemical Engineering Journal 3.8

编辑推荐:

  基因组规模代谢模型中基因-蛋白-反应关联的构建方法、数据库及挑战综述。指出需开发开放方法论以减少误差积累,并探讨自动化算法的改进方向。

  
P?nar Kocaba?
埃盖大学生物工程系,土耳其伊兹密尔博尔诺瓦35100

摘要

基因组规模的代谢模型(GEMs)是探索细胞代谢状态和解释复杂生物数据的强大工具。这些模型的一个关键组成部分是基因-蛋白质-反应(GPR)关联,它通过布尔逻辑将基因与酶促反应联系起来,以考虑同工酶和蛋白质复合物。GPRs的准确性以及化学计量矩阵共同决定了GEMs的预测性能。GPRs在构建特定条件下的细胞系和疾病模型中起着核心作用,并被广泛用于基因必要性分析、表达谱分析和菌株设计。本文回顾了哺乳动物和酵母GEMs中GPR构建的历史,总结了用于生成和管理的工具、数据库和方法,并指出了当前面临的挑战和限制。最后,讨论了改进GPR生成框架的潜力,以提高其在系统生物学和代谢工程应用中的实用性。

引言

基因组规模的代谢模型(GEMs)用于研究细胞的代谢状态,例如基于代谢基因和/或特定蛋白质的表达[1]。在GEMs中,基因-蛋白质-反应关联(GPRs)通过布尔关系将基因、酶和反应连接起来,这些关系描述了催化反应的酶,可能包含同工酶和蛋白质复合物亚基的信息,使用OR和AND规则来实现。GPRs的组成以及描述代谢物和反应之间化学计量关系的化学计量矩阵的平衡是影响GEMs准确性的两个参数[2]。因此,为了提高使用GEMs的下游分析的准确性,生成准确的GPRs非常重要。
GPRs用于生成特定条件下的模型、细胞系模型以及疾病组织/疾病模型[3]、[4]。GPRs的其他用途包括预测基因过表达或低表达、分析基因必要性以及解释基于约束的分析结果[5]。从更广泛的角度来看,GPRs对于合理的菌株设计、多组学数据整合以及预测突变菌株和缺失突变体的表型非常重要,这些菌株可以通过迭代改进来获得经济上可行的产品产量、滴度和生产力。
本文首先总结了用于生成GPRs的通用数据库,然后按时间顺序介绍了哺乳动物和酵母GEMs中GPRs的历史生成方法。本文的目的是汇编用于GPR生成和管理的来源、数据库和当前方法。在此基础上,讨论了为解决当前最佳实践中发现的不足而需要改进的GPR生成格式的相关问题。图1给出了本研究假设/问题的示意图。

小节片段

用于生成GPRs的通用数据库

数据库对于生成和管理GPRs非常重要。一些数据库提供基因-蛋白质-反应关联(例如KEGG [6]、Reactome [7]、UniProtKB [8]),而有些数据库仅提供基因列表(例如NCBI Entrez [9])或蛋白质列表(例如Complex Portal [10])。本节旨在总结最常用的数据库及其在GPR生成中的具体重要性。有四个基本的通用数据库用于生成GPRs:Reactome [7]、KEGG [6]、Complex Portal

GEMs中的GPR生成:时间顺序概述

本节总结了14个哺乳动物GEMs和43个酵母GEMs中的GPR管理来源:8个人类GEMs(时间跨度为2007年至2025年),4个小鼠GEMs(时间跨度为2010年至2025年),2个大鼠GEMs(时间跨度为2017年);18个Saccharomyces cerevisiae GEMs(时间跨度为2003年至2025年),10个Komagataella phaffii GEMs(时间跨度为2010年至2025年),6个Yarrowia lipolytica GEMs(时间跨度为2012年至2025年),3个Scheffersomyces stipitis GEMs(时间跨度为2012年至2025年)以及其他6个酵母GEMs。

生成GPRs的算法

手动生成或管理基因组规模的GPRs非常耗时。然而,在小规模GEMs中,手动管理GPRs仍然具有价值。因此,需要自动化算法来生成GPRs,同时可以手动辅助GPR管理。目前只有三种自动化算法可以自动生成GPRs,这些算法在表3中进行了总结。
Mendoza等人[114]总结了用于重建GEMs的软件工具,如AuReMe

挑战与未来展望

文献表明,GEM重建和GPR生成通常是相互关联的。小鼠、大鼠和许多酵母GEMs的GPRs是通过同源性和直系同源性方法生成的;然而,在最早的人类GEMs [22]、[23]、[24]、[25]、[26](EHMN [22]、Recon1 [23]、HMR [24]、Recon2 [25]、HMR2 [26])中并未明确说明GPRs的生成方式。提到较旧GEMs中的GPR规则被用于更新新的人类GEMs中的GPR规则[2]、[27]、[28]

结论

GPRs对于代谢工程中的应用至关重要,但通常是从现有数据库重用而不是重新创建的。GEMs中GPRs的来源并未得到明确说明,因此未来需要开发一种开放的方法论。本文表明,需要更多的开放方法来生成GPRs,以减少错误积累并生成更准确的GPRs。
为了生成正确且最准确的GPRs

资助

本研究未获得任何外部资助

利益冲突声明

我声明没有利益冲突。

致谢

作者感谢Mihail Anton和Feiran Li博士对手稿的概念化、见解和评论所做的宝贵贡献。图表由Feiran Li博士制作。基于Cardoso等人[109]的数据,Feiran Li博士计算了Yeast GEM [64]的MCC和准确性,并将其与文献[64]进行了比较。本研究中使用Yeast8 [64]和Yeast8-grRuler进行了基因必要性分析。

声明

作者声明没有利益冲突
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号