代谢通量锥学习:精准预测基因缺失表型的新范式及其在生物技术与医学中的应用

【字体: 时间:2025年09月27日 来源:Nature Communications 15.7

编辑推荐:

  研究人员开发了Flux Cone Learning(FCL)框架,通过蒙特卡洛采样与监督学习结合,利用代谢空间几何特征预测基因缺失表型。该研究突破了传统Flux Balance Analysis(FBA)对最优性假设的依赖,在Escherichia coli、Saccharomyces cerevisiae和CHO细胞中实现了更精准的代谢基因必需性预测,并成功应用于小分子合成表型预测,为多物种表型预测提供了通用工具。

  
基因删除对细胞表型的影响是生物学发现、生物医学和生物技术领域的核心问题。尽管高通量技术(如CRISPR-Cas9)已能实现全基因组范围的缺失筛选,但其成本高、复杂度大,亟需计算方法的补充。传统金标准Flux Balance Analysis(FBA)基于最优性假设(如最大化生物量合成),在微生物中预测效果良好,但在高等生物中因缺乏明确的最优性目标而表现不佳。此外,FBA无法灵活预测非生长相关表型(如小分子合成)。这些局限性促使研究者探索不依赖最优性假设的新方法。
为此,Charlotte Merzbacher等人开发了Flux Cone Learning(FCL),一种基于机器学习的新框架,通过蒙特卡洛采样和监督学习,从代谢空间的几何特征中预测基因缺失的表型效应。该研究发表于《Nature Communications》,展示了FCL在多种生物中的卓越预测能力及其在代谢工程中的广泛应用潜力。
研究主要采用以下技术方法:
  1. 1.
    基于基因组尺度代谢模型(Genome-Scale Metabolic Model, GEM)构建野生型和基因缺失型代谢网络;
  2. 2.
    使用OptGPSampler进行蒙特卡洛采样,生成高通量代谢通量数据;
  3. 3.
    整合实验获得的适应性评分(如基因必需性标签、小分子荧光强度),通过随机森林、梯度提升等监督学习算法训练预测模型;
  4. 4.
    利用交叉验证和独立测试集评估模型性能,并与FBA预测结果对比。

学习代谢空间的几何特征

FCL的核心在于通过随机采样捕捉基因缺失导致的代谢通量锥(flux cone)形状变化。研究者首先在5种病原菌中验证了通量锥几何的可学习性:通过变分自编码器(VAE)对共享代谢反应采样数据降维,发现不同物种的通量锥在低维空间中明显分离,证明几何特征可被机器学习模型捕获。这一发现为构建跨物种代谢基础模型奠定了基础。

大肠杆菌代谢基因必需性预测

在Escherichia coli iML1515模型中,FCL以随机森林分类器预测基因必需性,训练集涵盖1202个基因缺失(每缺失采样100个通量样本),测试集包含300个基因。FCL的预测准确率显著超越FBA,且仅需每个锥体10个样本即可达到FBA水平。特征重要性分析显示,运输和交换反应是顶级预测因子。模型对早期GEM(如iJR904)的适应性略差,但整体鲁棒性较强。

高等生物中的必需性预测

在Saccharomyces cerevisiae(酵母)和中国仓鼠卵巢细胞(CHO)中,FCL同样优于FBA。酵母模型Yeast9的预测通过5折交叉验证实现高精度,CHO细胞模型虽因GEM注释不完全而增益有限,但仍稳定超越FBA。这表明FCL在不依赖最优性假设的情况下,能广泛应用于复杂生物系统。

小分子合成预测

研究者进一步应用FCL预测酵母中betaxanthin(甜菜黄素)的合成能力。基于811个代谢基因缺失的荧光强度数据,训练多分类模型(低、中、高产菌株)。尽管数据存在类别不平衡(高产菌株仅占15.7%),通过类别重平衡技术,模型准确率达到69.8%,显著提升高产类别的识别率。这是首次证明缺失筛选数据可用于小分子合成预测,且无需在GEM中引入异源途径的化学计量信息。

结论与意义

FCL通过融合机制性模型(GEM)与数据驱动方法,建立了表型预测的新范式。其核心优势在于:
  1. 1.
    无需最优性假设,可应用于缺乏明确代谢目标的生物(如人类细胞系、肠道微生物组);
  2. 2.
    支持多种表型预测(包括必需性、合成致死、小分子生产等);
  3. 3.
    高通量采样数据的高维特性反而提升了模型性能,因为边界样本足以捕捉锥体形状变化。
该研究为代谢基础模型的构建铺平了道路,通过大规模跨物种采样,有望实现更广泛的表型预测。在生物医学领域,FCL可用于发现癌症治疗靶点或抗菌策略;在生物技术中,它能指导高效菌株设计,减少实验成本。未来工作需克服类别不平衡问题,并整合多组学数据以进一步提升预测精度。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号