评估微生物群落代谢模型(MICOM)在预测婴儿结肠菌群短链脂肪酸生产中的准确性:基于体外发酵数据的验证研究
【字体:
大
中
小
】
时间:2025年09月26日
来源:Frontiers in Nutrition 5.1
编辑推荐:
本综述系统评估了微生物群落模型(MICOM)在模拟断奶婴儿结肠菌群功能(尤其是短链脂肪酸SCFA生产)中的预测准确性,通过与体外粪便发酵实验数据对比,发现模型在植物性食物样本中表现较好(如乙酸盐r=0.31, p=0.005),但在含婴儿配方奶的复合样本中预测能力有限。研究强调代谢模型应作为传统实验方法的补充工具,并指出未来需优化微生物代谢重建、整合多组学数据及动态模拟以提高预测可靠性。
饮食成分与结肠菌群的相互作用因其对宿主健康的影响而备受关注。从健康角度而言,菌群功能变化比组成变化更具意义。微生物代谢产物(如短链脂肪酸SCFAs)的失衡可能区分疾病与健康状态,尽管微生物分类存在个体差异。SCFAs包括乙酸盐、丙酸盐和丁酸盐,对维持结肠屏障完整性、提供结肠细胞能量及神经保护具有重要作用。
当前研究多集中于复杂碳水化合物对成人菌群的影响,而其他饮食成分(如脂肪酸和多酚)的作用,尤其在婴儿和老年人群中的研究较少。临床试验是评估饮食-菌群相互作用的金标准,但存在耗时、资源密集及伦理问题。数学模型(如代谢模型)作为补充工具,可降低成本与时间。多种模型已被用于研究饮食-菌群互作,包括动力学模型、代理模型和基因组尺度代谢模型(GEMs)。GEMs使用代谢重建和通量平衡分析(FBA)预测微生物代谢通量。宏基因组尺度群落代谢模型(MGCMs)将这一概念扩展到微生物群落,其中微生物群落模型(MICOM)以其用户友好性、详尽文档和预制工作流程脱颖而出。
然而,MGCMs的实验验证具有挑战性。近期研究比较了MICOM预测与离体粪便孵育的SCFA通量,在膳食纤维影响下,丙酸盐和丁酸盐的预测与实验结果一致。但该模型在预测全食物对菌群功能的准确性尚未探索。食物包含多种饮食成分,可能在消化过程中相互作用,共同影响菌群。
本研究旨在评估MICOM在模拟婴儿实际喂养场景中预测微生物SCFA生产的准确性。通过比较模型预测的乙酸盐、丙酸盐和丁酸盐通量与已发表的体外粪便发酵实验数据,评估模型在模拟婴儿辅食(单独或与配方奶及其他食物组合)对断奶婴儿结肠菌群SCFA生产的影响中的表现。
实验测定的乙酸盐、丙酸盐和丁酸盐通量源自一项粪便发酵研究。该研究使用粪便样本作为代理,评估了辅食对断奶婴儿结肠菌群组成和SCFA生产的影响。测试了53个样本,包括食物成分单独及与配方奶或其他食物组合。样本通过体外静态模型(基于INFOGEST协议)消化,模拟6月龄婴儿胃肠道条件,随后在37°C下用6名健康断奶婴儿(5-11月龄)的混合粪便接种体发酵24小时。
有机酸经盐酸酸化、乙醚提取、N-叔丁基二甲基硅基-N-甲基三氟乙酰胺衍生化后,通过气相色谱与火焰离子化检测器检测。使用2-乙基丁酸作为内标校正批次变异。SCFA生产量通过发酵前后浓度差计算,并按样本干重归一化。通量通过将各有机酸浓度除以发酵时间(24小时)得出。
模拟在Python(3.9.10版本)环境中使用MICOM(0.37.0版本)和CPLEX优化求解器(22.1版本)进行。采用AGORA2(Assembly of Gut Organisms through Reconstruction and Analysis version 2)代谢重建推断婴儿粪便菌群的代谢。数据与代码公开于GitHub仓库。
培养基设计遵循先前研究的工作流程,使用Virtual Metabolic Human数据库的“Design a diet”功能选择食物以匹配实验样本。硅基培养基设计为与实验相同的干物质量(150克),以复现实验条件(使用1.5克冻干食物,标量放大以缓解数值不稳定性)。相同方法用于设计食物组合培养基,包括食物与配方奶、食物与食物、及食物-食物-配方奶组合,保持与体外实验相同的比例。
导入数据通过MICOM培养基设计流程处理,添加宿主分泌化合物(黏蛋白核心和胆汁酸),移除小肠吸收的稀释化合物,并补充缺失营养素以确保群落生长率为0.3/小时。最后,培养基化合物稀释10倍以匹配实验条件(约10%消化后样本体积与粪便接种体发酵)。由于MICOM工作流程未直接模拟消化,假设硅基培养基组成反映实验消化后样本的化学 profile。
模拟中使用的微生物群落相对丰度基于体外粪便发酵研究的基线值。由于实验使用16S rRNA基因测序,模拟在属水平进行。测序数据通过Cutadapt和Trimmomatic处理引物,DADA2流程进行去噪、截断、嵌合体移除和ASV推断。使用SILVA数据库(138.1版本)进行分类分配,并通过microbiome包将ASV折叠至属水平。仅包含相对丰度≥0.001的属以减少数值不稳定性和处理时间。共31个属(占群落相对丰度99.3%)被纳入模拟。使用AGORA2代谢重建为这些属构建泛模型,将微生物代谢菌株池化至更高分类等级。
模拟遵循已发布协议。MICOM基于质量稳态假设下的FBA,代表微生物生长的指数期,生长率保持恒定。微生物代谢通量作为约束线性规划问题的解计算,整合群落生化反应,假设无底物积累,以最大化群落生物量。MICOM采用群落最大生长与个体微生物生长之间的权衡策略,防止高丰度微生物以低丰度为代价生长。通过“tradeoff”函数确定各硅基培养基的最优合作权衡值(范围0.4-0.7)。MICOM使用线性化策略将个体类群生长率与其相对丰度关联,因此群落预期在不同硅基培养基中展现一致生长模式,高丰度属预测有更高生长率。微生物相对丰度作为生物量代理,代谢通量按微生物生物量干重归一化(单位毫摩尔/克干重/小时)。
为解释硅基与体外研究设计的差异,计算测定和预测通量的标准分数(z分数)。z分数描述值与均值相差的标准差数,便于不同设计研究间的比较。使用Python计算测定与预测z分数间的Pearson相关系数(r)和双尾p值。通过Bland-Altman分析评估预测与测定z分数的一致性,计算95%一致性限(平均差±1.96标准差)。使用Shapiro-Wilk检验验证数据正态性。热图和雷达图使用matplotlib、seaborn和SciPy生成。
3.1 预测与测定SCFA生产的Pearson相关性
相关性分析显示预测与测定乙酸盐生产间存在弱一致性(r=0.17, p=0.03)。这是整个数据集中唯一显著的相关性。为探究食物成分与其他饮食化合物组合是否影响模型准确性,后续分析将样本聚类为:食物成分单独、食物与配方奶组合(食物-配方奶组合)、食物与食物组合(食物-食物组合)、及食物-食物-配方奶组合。食物成分单独中,丁酸盐预测与测定呈现弱相关趋势(r=0.28, p=0.07)。食物-食物组合中,模型预测与实验生产的乙酸盐和总SCFA呈现中度相关(r=0.43和0.41, p=0.006和0.01),而丙酸盐呈现弱负相关趋势(r=?0.30, p=0.06)。食物-配方奶和食物-食物-配方奶组合中无显著相关性。
鉴于配方奶与食物组合降低模型准确性,分析仅包含食物成分和食物-食物组合(主要基于植物性食物的样本)。于此子集,乙酸盐呈现中度一致性(r=0.31, p=0.005),丁酸盐呈现弱正相关趋势(r=0.21, p=0.06),丙酸盐呈现弱负相关趋势(r=?0.19, p=0.08)。排除动物性食物样本后结果相似。
通过Shapiro-Wilk检验验证食物成分和食物-食物组合数据集的正态性。个体SCFA的预测与测定z分数差服从正态分布,但其和不服从。因此仅对乙酸盐、丙酸盐和丁酸盐生成Bland-Altman图。由于通量被标准化为z分数,所有图的z分数平均差为零。乙酸盐的一致性限最低,表明预测与测定z分数间的一致性更好。多数样本落在主要SCFA的95%一致性限内,但部分样本超出:乙酸盐81个中的5个,丙酸盐81个中的2个,丁酸盐81个中的7个。这表明模型在整个数据集中准确预测实验结果的能力有限。
通过热图和雷达图可视化硅基与体外结果比较(仅包含食物成分和食物-食物组合)。结果显示多处不一致。例如,黑豆与黑醋栗组合在体外有最高丁酸盐生产,但模型预测猪肉与黑醋栗或古斯米组合有最高丁酸盐生产。食物成分中,鹰嘴豆、古斯米、大豆和kūmara样本的z分数存在显著差异,仅丁酸盐预测与实验结果匹配。模型未准确预测草莓在体外增加丙酸盐和总SCFA生产的能力。另一方面,模型令人满意地预测了带皮kūmara在食物成分中具有最高丁酸盐生产,黑醋栗与草莓组合在食物-食物组合中具有最高乙酸盐和总SCFA生产。模型还捕捉到黑醋栗和树莓相较于其他食物增加总SCFA生产的影响。
为评估预测质量是否依赖于输入微生物组成,使用各样本发酵后相对丰度进行额外模拟。与初始结果一致,模型与实验结果整体一致性差,所有样本的预测与测定z分数间无显著相关性。但限制于食物-配方奶组合时,乙酸盐生产呈现中度正相关(r=0.42, p=0.008),总SCFA生产呈现正相关趋势(r=0.28, p=0.08)。类似初始结果,涉及富含蛋白质食物(如猪肉-配方奶和虾-配方奶)的食物-配方奶组合显示预测与测定结果间最大差异。
本研究比较了使用MICOM硅基预测的乙酸盐、丙酸盐和丁酸盐生产与粪便发酵实验测定值。专注于评估模型预测健康相关代谢物(而非微生物生长)的准确性,源于缺乏体外个体微生物生长率数据。从健康角度,菌群功能比组成更具信息性,因结肠微生物功能冗余,健康个体结肠菌群尽管分类差异仍保持类似功能。硅基模拟和统计比较的工作流程遵循已发布协议。另一优势是评估模型在预测断奶婴儿实际喂养模式(包括全食物、食物组合、配方奶或二者)下结肠菌群SCFA生产的准确性。
评估所有样本时,模型准确性差,仅乙酸盐呈现弱相关性。有趣的是,分析主要基于植物性食物的样本时准确性提高。乙酸盐呈现中度正相关,丙酸盐和丁酸盐分别呈现弱正和弱负相关趋势。这些发现表明MICOM在预测婴儿菌群功能时,对富含复杂碳水化合物的培养基准确性更高。这一结果预期,因复杂碳水化合物对结肠微生物的影响远比其他饮食成分更被了解。因此,结肠微生物的代谢重建常未针对氨基酸和脂质利用的生化反应进行优化。此结果也可能由断奶婴儿结肠菌群的功能能力驱动。观察性研究显示断奶婴儿菌群从主要降解人乳寡糖过渡到代谢复杂碳水化合物,而氨基酸发酵增加但仍不如成人结肠菌群显著。
鉴于相关性分析评估两变量间关系强度而非差异,通过Bland-Altman分析确定预测与测定SCFA生产的一致性限(95%置信区间)。使用标准分数以解释方法间的量级和单位差异。乙酸盐的一致性限低于丙酸盐和丁酸盐,表明预测与测定z分数间更强一致性,与相关性结果一致。多数食物和食物-食物组合样本落在95%一致性限内,但部分例外突显模型在整个数据集中准确预测SCFA实验生产的能力有限。
食物成分和食物-食物组合中,观察到体外与硅基结果间的多处不一致。例如,草莓和黑豆-黑醋栗组合在体外有正总SCFA生产z分数,但硅基为负。另一方面,一些驱动体外最高总SCFA生产的样本(如黑醋栗、树莓和黑醋栗-草莓组合)在硅基中也导致高正z分数。评估微生物组成对预测准确性影响的敏感性分析表明群落组成强烈影响模拟结果。但模型在SCFA和样本间持续展现有限预测性能,乙酸盐在碳水化合物丰富样本中一致性更好。作为核心信息,本研究证明新兴的饮食-结肠菌群互作建模方法不完美,不应替代实验方法。鉴于其成本和时间效率及利用现有数据的能力,这些模型提供了有价值的起点,生成指导体外和体内研究设计的见解。其进一步优化和作为补充工具的使用代表推进饮食-结肠菌群研究的有希望机会。
MGCMs的未来发展方向包括扩展高质量微生物代谢重建的数量,应使用满足质量标准的测序数据构建并随后用实验数据优化。鸟枪法宏基因组测序数据优于16S rRNA测序数据,因更准确捕捉结肠微生物的代谢潜力。实验数据对模型优化和验证仍至关重要,尤其需要更多研究结肠微生物响应各种饮食化合物的行为。MGCMs的准确性还可受益于整合多组学数据(如宏转录组学)以更好个性化模型条件。此外,整合动态FBA可改进对结肠环境随时间变化的表示。最后,用于硅基模拟培养基设计的数据库需进一步优化以更好解释个体间饮食模式的异质性。
我们的结果与先前研究部分对比,该研究报道MICOM对丙酸盐和丁酸盐的预测与使用成人接种体的离体粪便孵育实验结果一致。此处观察到的 modest 性能可能源于研究设计差异。断奶婴儿粪便菌群相较于成人菌群有 distinct 功能,包括更高比例的乙酸盐生产和更低的丙酸盐与丁酸盐生产。此外,全食物是复杂基质,不仅含纤维还有蛋白质、脂肪和植物化学物,均影响结肠微生物功能。最后,虽引用研究使用宏基因组数据在种水平构建模型并基于微生物生物量归一化SCFA预测,我们的模拟限于属水平且因使用16S rRNA测序数据未整合生物量归一化,从而降低代谢特异性。这一对比结果突显需进一步研究模型在不同研究条件和宿主人群中的预测准确性,尤其关于健康相关代谢物(如丁酸盐)的生产。
本研究的主要限制是不同方法获得的结果差异,因硅基预测的通量不等同于体外测定的代谢物浓度。为解决此限制,我们遵循已发布协议使用标准分数比较不同方法论结果并验证MICOM对丙酸盐和丁酸盐生产的预测。然而,使用静态体外发酵量化SCFA通量是有限表示,因代谢物积累和底物耗尽随时间发生。在长发酵期内,这些条件偏离FBA模型固有的动态条件和稳态假设(假设系统内无底物积累)。
此外,基于FBA的模型准确性强烈依赖于模拟中使用的代谢重建质量。近期对FBA工具(包括MICOM)的系统评估报道,使用AGORA代谢重建时,微生物生长率的预测准确性相较于实验数据较低。作者强调半优化代谢重建对预测微生物行为不够准确。我们的模拟使用AGORA第二版本,通过半自动化流程生成并手动优化。但需认识到这些重建可能包含 gaps 或不准确分配的生化反应。
另一限制是使用混合粪便数据,源于体外发酵研究缺乏个体水平数据。尽管混合粪便样本在此类研究中常见,它 inevitably 改变原始微生物群落结构,降低个体间变异和功能分辨率。这些变化可能以未被混合样本分类 profile 捕捉的方式影响微生物功能动力学。使用扩增子16S测序数据将模型构建限于属水平,可能掩盖微生物种间的代谢差异。此外,此方法减少模拟中包含的类群数并阻碍SCFA预测的生物量归一化。值得注意的是,低丰度但生物学意义重大的菌种(keystone species)在使用16S rRNA测序数据时可能未被充分代表。而且,依赖微生物相对丰度作为绝对量的代理可能受类群间相互依赖 bias 且不能准确反映微生物群落的真实组成,影响模型预测。为克服此限制,模拟应基于绝对微生物生物量,通过宏基因组学或测序结合qPCR估算。
此外,硅基培养基使用Virtual Metabolic Human数据库设计,该数据库缺乏多样烹饪方法和食物成分的信息。值得注意的是,实验工作中使用的新西兰土著食物(如kūmara)未包含在数据库中,必须用最相似可用食物替代。最后,虽体外研究使用静态协议模拟饮食化合物的消化和吸收,MICOM如其他饮食-菌群模型当前未 account for 消化。相反,它通过标量稀释被识别为被人肠吸收的饮食化合物表示吸收。不 account for 消化是硅基与体外结果间变异的主要潜在来源,因消化影响食物结构,从而影响微生物发酵可及的营养 profile。然而,此限制是建模框架固有的,因计算模拟食物消化具有挑战性。尽管有希望的工具正在涌现,它们尚未被整合入MGCMs。
本研究评估了宏基因组尺度群落代谢模型MICOM在预测断奶婴儿实际辅食喂养模式下粪便菌群SCFA生产的准确性,使用静态体外粪便发酵数据作为比较器。预测与测定乙酸盐生产间观察到弱正相关。分析主要基于植物性食物的样本时,预测与测定SCFA通量的一致性提高。这些发现表明模型在模拟富含复杂碳水化合物的培养基时更准确复现实验结果。尽管特定SCFA的实验与模拟结果间存在不一致,模型识别了体外具有最高总SCFA生产的样本。这例证了模型作为传统实验方法替代品的局限性,但支持其作为补充工具的潜力。进一步模型开发对提高其准确性至关重要,尤其对于富含脂肪和蛋白质的培养基。优化后的模型版本将有助于推进饮食与菌群关系的研究。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号