GEMsembler:跨工具基因组尺度代谢模型(GEMs)的共识组装与结构比较提升功能预测性能

【字体: 时间:2025年09月09日 来源:mSystems 4.6

编辑推荐:

  这篇研究介绍了GEMsembler——一款创新的Python工具包,用于整合不同工具构建的基因组尺度代谢模型(GEMs),通过结构比较和共识模型组装提升代谢网络预测准确性。研究以植物乳杆菌(Lactiplantibacillus plantarum)和大肠杆菌(Escherichia coli)为例,证明共识模型在营养缺陷型(auxotrophy)和基因必需性(gene essentiality)预测中优于人工金标准模型,同时提供基因-蛋白-反应(GPR)规则优化框架,为系统生物学和代谢工程研究提供高效建模解决方案。

  

GEMsembler:跨工具代谢模型整合与功能优化

生成跨工具共识模型

GEMsembler通过四步流程整合不同工具构建的基因组尺度代谢模型(GEMs):首先统一代谢物、反应和基因的命名(如转换为BiGG数据库ID),随后将模型合并为超模型(supermodel),生成不同置信水平的共识模型(如core3表示至少3个工具支持的代谢特征),最后进行功能分析。超模型结构兼容COBRApy框架,保留各模型来源信息,支持反应方向性、GPR规则等属性的智能合并。例如,大肠杆菌四种工具模型(CarveMe、gapseq、modelSEED、AGORA)中,仅25%代谢物被所有工具共同识别,而GPR规则的一致性更低,凸显工具间差异。

代谢网络置信度系统评估

通过拓扑分析和通量平衡分析(pFBA),研究量化了中心碳代谢和生物量合成途径的模型间一致性。植物乳杆菌模型中,琥珀酸合成路径因SUCDi和ABTA反应的差异存在不确定性;大肠杆菌的缬氨酸合成途径中,ACLS反应仅被半数工具识别,需实验验证。生物量前体合成能力的分析显示,大肠杆菌模型间一致性显著高于植物乳杆菌,后者仅6种前体被所有工具确认。GEMsembler通过交互式路径图谱(如HTML格式的可视化网络)定位关键分歧反应,指导实验优先验证。

基于共识的模型优化

通过调整生物量反应(保留≥3工具支持的代谢物)和补充缺失路径,研究构建了可生长的核心共识模型。例如,植物乳杆菌core3模型需添加72个反应(含28个转运反应)以恢复ATP合成(通过双向AIRCr反应)和硫胺素二磷酸(tmpp_c)生产路径。优化后模型代谢物(639种)、反应(729个)和基因(420个)数量均少于原始模型,但MEMOTE评估显示其技术质量显著提升。

性能超越金标准模型

在植物乳杆菌CDPM培养基营养缺陷型预测中,GEMsembler-curated core3模型正确预测了谷氨酸和核黄素的必需性,而金标准模型iLP728因错误包含P5CD反应(无GPR支持)导致假阳性。大肠杆菌基因必需性预测中,共识模型AUCPR达0.556,经遗传算法(GA)优化GPR规则后提升至0.711(如将dethiobiotin合成酶反应GPR从单基因b0778改为b0778或b1593),优于调整后的iML1515a模型(AUCPR=0.767)。

应用前景与局限性

GEMsembler的模块化设计支持扩展至微生物群落模型比较和代谢工程靶点筛选。当前依赖BiGG数据库可能遗漏部分代谢物,未来可整合更多数据库。研究强调工具间差异对预测的影响——例如,不同GPR规则组合可解释30%的基因必需性预测改进,为实验设计提供明确方向。通过半自动化流程,该工具显著缩短了“设计-构建-测试-学习”循环周期,推动精准代谢建模发展。

(注:全文严格依据原文数据,未添加非文献结论;专业术语如pFBA、GPR等均按原文格式标注;上标/下标已按规范调整。)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号