编辑推荐:
为解决当前基因组规模重建资源受限问题,研究人员开展 “构建大规模微生物基因组规模代谢重建资源” 研究。他们开发优化流程构建 APOLLO 资源,包含大量微生物基因组和群落模型。这为系统研究微生物代谢能力提供了新机遇。
在人体健康的大舞台上,微生物扮演着至关重要却又神秘莫测的角色。人体微生物组与健康和疾病密切相关,比如肠道微生物组的变化与多种疾病挂钩,像 cardiometabolic、炎症性肠病、神经系统疾病等 ;皮肤和阴道微生物组也与痤疮、细菌性阴道炎等疾病有关。而且,“西方化” 生活方式会改变微生物组组成,影响健康。
研究微生物组的代谢对于理解其在健康和疾病中的作用至关重要。目前,基于约束的重建和分析方法(COBRA)为研究微生物代谢提供了有力框架,通过构建基因组规模的代谢重建模型,能模拟微生物的代谢过程。然而,现有基因组规模重建资源存在诸多限制。一方面,以往的自动化重建流程仍有许多手动步骤,效率不高;另一方面,像 AGORA2 这样的资源,依赖培养菌株的参考基因组,存在培养偏差,导致某些类群代表性不足,且无法涵盖未培养菌株。此外,随着宏基因组组装基因组(MAGs)数量不断增加,却没有与之匹配的大规模微生物代谢重建资源,相关计算和分析面临巨大挑战。
为了突破这些困境,来自爱尔兰高威大学(University of Galway)等机构的研究人员开展了一项极具意义的研究。他们开发了优化且高度并行化的重建和分析流程,构建了名为 APOLLO 的资源,包含 247,092 个微生物基因组规模代谢重建和 14,451 个微生物群落模型 。这一成果发表在《Cell Systems》上,为深入了解微生物代谢能力开辟了新道路。
研究人员在研究过程中运用了多种关键技术方法。首先,从已发表的研究中获取 MAGs,包括 Pasolli 和 Almeida 资源中的大量基因组 。然后,利用 KBase 在线平台生成草图重建,通过 DEMETER 管道进行半自动优化 。此外,借助机器学习算法,如随机森林模型,预测菌株的分类学归属,并对微生物群落模型进行分析。
研究结果主要体现在以下几个方面:
- 优化的重建和模拟流程:利用 KBase 的叙事界面和 DEMETER 管道,结合众包和高性能计算,实现了从数千到数十万基因组规模重建的扩展,证明了 COBRA 建模可适应不断增加的公开可用基因组和宏基因组数据。
- 高质量的基因组规模重建:从两个 MAG 资源构建了 247,092 个半自动化优化的基因组规模重建,虽与 AGORA2 相比在代谢覆盖和通量一致性反应比例上较小,但在热力学可行性和生长速率方面相似 。
- 分类学相关菌株的代谢相似性:APOLLO 的分类学分布更接近典型人类微生物组组成,分类学相关菌株在反应内容和预测代谢能力上相似,且代谢特征可用于预测菌株的分类学归属。
- APOLLO 增加微生物覆盖范围:构建的 14,451 个个性化微生物群落模型,结合 APOLLO 和 AGORA2 资源,显著增加了微生物覆盖范围和相对丰度,提升了代谢预测的准确性。
- 机器学习识别关键特征:通过机器学习分类器,确定了能区分不同微生物组样本的关键反应,如根据少数反应可区分健康微生物组的身体部位、疾病状态等。
- 微生物组模型的统计分析:统计分析揭示了不同组之间代谢途径结构和功能的差异,某些疾病状态与健康对照之间存在明显差异,而另一些差异较小。
- 代谢物分泌潜力的差异:代谢群落模型预测了不同疾病状态和健康对照之间代谢物分泌潜力的差异,如炎症性肠病(IBD)、帕金森病(PD)和营养不良儿童的肠道微生物组中,多种代谢物的分泌潜力发生改变。
研究结论表明,APOLLO 资源为研究人员提供了强大的工具,可系统研究微生物的代谢能力。与基于参考基因组的资源相比,APOLLO 在分类学覆盖上更具优势,能更好地反映人类微生物组的真实情况,有助于深入了解未培养和未分类物种的代谢能力。同时,通过构建个性化微生物群落模型,研究人员发现不同身体部位、年龄、疾病状态下微生物组的代谢特征存在差异,这为进一步研究微生物与宿主健康的关系提供了重要线索。此外,研究还发现一些关键反应可作为分类学标记,有助于对未分类菌株进行分类。然而,研究也存在一定局限性,如目前的流程计算要求高、耗时长,部分模拟仅针对部分代谢物和样本。未来,随着技术的不断进步和流程的优化,有望更充分地利用 APOLLO 资源,深入探索微生物代谢的奥秘,为个性化医疗、疾病预防和治疗等领域提供更有力的支持。