
-
生物通官微
陪你抓住生命科技
跳动的脉搏
微生物组知识图谱MicrobiomeKG:构建微生物组研究与宿主健康的桥梁
【字体: 大 中 小 】 时间:2025年08月30日 来源:Frontiers in Systems Biology 2.3
编辑推荐:
这篇综述介绍了MicrobiomeKG知识图谱的创新性工作,通过算法从论文补充表格中提取知识断言(knowledge assertions),标准化为生物链接模型(Biolink)的节点-边结构,并利用神经网络进行边缘评分(edge scoring)和中心性分析(centrality analyses)。研究通过三个案例(蠕虫感染与NAFLD关联、Alistipes属与炎症的分子连接、双歧杆菌属在ADHD中的核心作用)验证了该图谱在发现微生物-宿主健康关系中的价值,为个性化医疗和跨组学整合分析(multiomic integration)提供了新工具。
微生物组知识图谱的构建与突破
微生物组作为人体内数万亿微生物的复杂群落,对宿主健康具有深远影响。MicrobiomeKG通过创新方法从40篇论文的104个补充表格中提取112,118条知识断言,构建了包含27,772个节点的知识图谱,填补了微生物组与宿主健康研究的空白领域。
标准化与智能分析技术
研究团队开发了基于PyTorch的神经网络模型,通过11项特征(包括样本量、统计检验方法、FDR校正等)对边缘进行标准化评分(0-178分范围),解决了不同研究间异质性问题。图谱采用生物链接模型(Biolink)的8种谓词(如correlated_with、affects)和38个本体类别,所有节点均通过BABEL工具(2025/03/31版)归一化为CURIEs标识符。
案例一:寄生虫感染与脂肪肝的微生物桥梁
图谱揭示了蠕虫感染(MONDO:0004664)通过改变Burkholderiales目(p=0.0026)和Lactobacillales目(p<0.0001)菌群与非酒精性脂肪肝(NAFLD)的关联。其中,Betaproteobacteria类通过孟德尔随机化分析显示对NAFLD的因果影响(IVW法p<0.0218),而Parasutterella属(Burkholderiales目)的负相关性被Yun等(2019)的临床数据支持,这为寄生虫流行区与代谢疾病的共现现象提供了机制解释。
案例二:Alistipes菌属的炎症网络
研究发现Alistipes菌属与多种炎症标志物存在复杂关联:
• 基因层面:正相关促炎基因Saa1(急性期蛋白)和Ghr(生长激素受体),负相关抗炎基因Tnfrsf11a(自炎症调节因子)
• 代谢物层面:与短链脂肪酸(SCFAs)如丁酸(Spearman r=-0.31)、丙酸(r=-0.366)显著负相关
• 色氨酸代谢:与3-甲酰吲哚(抗炎物质)的弱正关联(Wald检验p=0.0032)形成矛盾信号
这些发现印证了高动物蛋白饮食→Alistipes增殖→炎症通路的潜在机制。
案例三:ADHD的微生物枢纽
通过四种中心性算法(betweenness、eigenvector、Katz、PageRank)分析,双歧杆菌属(Bifidobacterium)被一致鉴定为注意力缺陷多动障碍(ADHD)最核心的微生物节点。其高枢纽性体现在:
• 桥接作用:betweenness centrality显示其连接ADHD与图谱其他部分
• 网络影响力:Katz centrality值反映其在全图中的广泛调控作用
• 临床证据:双歧杆菌补充剂Bf-688已在临床试验中显示改善ADHD症状
技术实现与未来方向
图谱通过Plover平台以TRAPI格式部署,支持Biomedical Data Translator生态系统的一跳查询(one-hop queries)。当前局限性包括数据规模(仅覆盖40篇论文)和半自动化提取流程。未来计划结合NLP和LLM技术实现全自动化扩展,并整合MGnify等数据库资源。
这项研究开创了从补充材料挖掘生物医学知识的新范式,其标准化框架为微生物组在精准医疗中的应用提供了可扩展的分析基础,特别是在揭示"微生物-代谢-基因"多维互作网络方面展现出独特价值。
生物通微信公众号
知名企业招聘