
-
生物通官微
陪你抓住生命科技
跳动的脉搏
mFLIP:代谢通量区间预测
《BMC Bioinformatics》:mFLIP: metabolic flux interval prediction
【字体: 大 中 小 】 时间:2026年06月10日 来源:BMC Bioinformatics 3.3
编辑推荐:
摘要 背景 理解细胞代谢通常需要准确估计代谢通量——即代谢物在生化途径中转化的速率。通量变异性分析(FVA)是计算反应通量区间的金标准。然而,由于该方法依赖于线性规划,因此在处理大规模、复杂
理解细胞代谢通常需要准确估计代谢通量——即代谢物在生化途径中转化的速率。通量变异性分析(FVA)是计算反应通量区间的金标准。然而,由于该方法依赖于线性规划,因此在处理大规模、复杂的基因组级代谢网络模型时计算量非常大,往往需要数小时甚至数天的时间。
为了解决这一限制,我们提出了mFLIP,这是一个基于机器学习的框架,用于预测代谢途径中的通量区间。这些模型使用了来自Metabolomics Workbench和MetaboLights的大规模代谢组学数据集进行训练,该数据集包含超过22,000个样本。评估了多种机器学习和深度学习方法,包括随机森林(Random Forest)、XGBoost、卷积神经网络(CNN)、图神经网络(GNN)、变分自编码器(VAE)和FT-Transformer。模型性能在六个独立的癌症数据集(乳腺癌、结肠癌、胰腺癌、前列腺癌以及透明细胞肾癌的两个阶段)上进行了独立验证。
所提出的方法将推理所需的计算时间从几分钟显著缩短到了不到一秒。在评估的模型中,随机森林(Random Forest)和XGBoost取得了最佳的整体性能,具有最低的回归误差和最高的分类分数。深度学习模型,特别是卷积神经网络(CNN)和FT-Transformer,也展示了有竞争力的结果。总体而言,所有提出的方法在准确性和计算效率方面都优于现有的最佳方法。
mFLIP为传统的基于FVA的代谢通量区间估计方法提供了一种快速且准确的替代方案。通过利用FVA衍生数据上的监督学习,它能够实现对大规模样本的可扩展分析,同时保持高预测性能,使其成为大规模代谢研究的实用工具。
理解细胞代谢通常需要准确估计代谢通量——即代谢物在生化途径中转化的速率。通量变异性分析(FVA)是计算反应通量区间的金标准。然而,由于该方法依赖于线性规划,因此在处理大规模、复杂的基因组级代谢网络模型时计算量非常大,往往需要数小时甚至数天的时间。
为了解决这一限制,我们提出了mFLIP,这是一个基于机器学习的框架,用于预测代谢途径中的通量区间。这些模型使用了来自Metabolomics Workbench和MetaboLights的大规模代谢组学数据集进行训练,该数据集包含超过22,000个样本。评估了多种机器学习和深度学习方法,包括随机森林(Random Forest)、XGBoost、卷积神经网络(CNN)、图神经网络(GNN)、变分自编码器(VAE)和FT-Transformer。模型性能在六个独立的癌症数据集(乳腺癌、结肠癌、胰腺癌、前列腺癌以及透明细胞肾癌的两个阶段)上进行了独立验证。
所提出的方法将推理所需的计算时间从几分钟显著缩短到了不到一秒。在评估的模型中,随机森林(Random Forest)和XGBoost取得了最佳的整体性能,具有最低的回归误差和最高的分类分数。深度学习模型,特别是卷积神经网络(CNN)和FT-Transformer,也展示了有竞争力的结果。总体而言,所有提出的方法在准确性和计算效率方面都优于现有的最佳方法。
mFLIP为传统的基于FVA的代谢通量区间估计方法提供了一种快速且准确的替代方案。通过利用FVA衍生数据上的监督学习,它能够实现对大规模样本的可扩展分析,同时保持高预测性能,使其成为大规模代谢研究的实用工具。