MetabFlow:外源性天然产物代谢图谱的构建与应用——填补代谢转化系统性知识空白

《Nucleic Acids Research》:MetabFlow: a comprehensive metabolic map for exogenous natural products

【字体: 时间:2025年11月29日 来源:Nucleic Acids Research 13.1

编辑推荐:

  本刊推荐:为解决外源性天然产物(NPs)代谢信息碎片化问题,研究人员开发了MetabFlow数据库,系统整合了7294条经人工校验的代谢反应(包括1981条酶催化反应和198条微生物介导反应),构建了结构化代谢网络,并收录约3200个未主流数据库索引的化合物。该数据库为NPs代谢机制研究、药物发现及安全性评价提供了全面数据支撑。

  
在生命科学领域,天然产物(Natural Products, NPs)一直是药物研发的重要源泉,但其潜在毒性也不容忽视。外源性NPs在体内和体外经历复杂的代谢转化,生成结构多样的代谢物。这一过程不仅涉及宿主酶系(如CYP450s、UGTs、β-葡萄糖苷酶),还受到肠道微生物群的深刻影响,导致水解、去甲基化、环化等多种反应。然而,现有代谢数据库或侧重于内源性代谢(如植物代谢网络PMN),或主要关注合成药物(如DrugBank),缺乏针对外源性NPs代谢反应的系统整合。尤其缺乏对酶催化与微生物介导反应的联合分析,以及标准化实验背景的注释,限制了对其代谢机制的系统性理解。
为解决这一瓶颈,杭州师范大学陶林团队在《Nucleic Acids Research》发表了题为“MetabFlow: a comprehensive metabolic map for exogenous natural products”的研究,开发了首个专注于外源性NPs代谢转化的综合数据库MetabFlow。该数据库通过四大创新点实现了代谢知识的系统整合:首先,系统整合了7294条经人工校验的代谢反应,覆盖体内外转化过程;其次,独特地融合了1981条酶催化反应与198条微生物介导反应,凸显NPs代谢特征;第三,通过构建上下游反应关系,建立了结构化代谢网络;第四,收录了约3200个未在主流数据库索引的化合物,并提供详细结构信息与完整代谢谱。MetabFlow数据库现已开放访问(https://bdg.hznu.edu.cn/metabflow/),无需登录即可免费使用。
研究团队通过多步骤技术路线构建数据库:首先,通过PubMed和Google Scholar关键词检索及现有数据库(DrugBank、AGORA2、MetXBioDB)交叉验证,筛选出1326篇文献中的代谢反应数据,并经专家人工校验确保准确性。其次,采用半自动化流程处理化合物信息:对已命名化合物通过PubChemPy获取CID;对无命名化合物,结合分子图像识别模型aExtractor与人工校正(ChemDraw v23.1)完成结构重建,并通过RDKit计算物化参数。此外,利用NPClassifier进行化合物分类注释,ADMETlab 3.0预测药代动力学性质。数据库后端采用Django框架与MySQL,前端基于Vue.js实现交互可视化,并通过ECharts动态展示代谢网络。

当前数据库内容与统计

MetabFlow共收录7711个NPs(含3200个未索引化合物),涉及7294条代谢反应。反应类型以羟基化(1228次)、葡萄糖醛酸化(1145次)、氧化(687次)为主;化合物分类显示黄酮类(725个)、三萜类(452个)等超类别占比最高。酶催化反应中CYP3A4、UGT1A9等关键酶,以及大肠杆菌、真杆菌等肠道微生物作用显著。

数据库页面访问与查询功能

数据库提供化合物名称/SMILES检索与结构相似性搜索(基于Ketcher分子编辑器)两种查询方式。化合物详情页(图2)展示其物化性质、ADMET参数及关联反应列表,并可通过实验物种与代谢通路筛选结果。反应详情页(图3)包含反应方程、酶/微生物参与信息及实验方法(如LC-HRMS)、样本来源等元数据。

天然产物反应网络可视化

MetabFlow通过构建上下游反应关系形成动态代谢网络。针对复杂网络采用子网络可视化策略(限5层层级),简单网络则全局展示。用户可通过交互界面追踪化合物转化路径,如蛇床子素(Osthol)案例中,其三级代谢网络包含64个反应,生成15个直接代谢物,清晰呈现羟基化为主通路(图4A)。

知识库应用案例

以蛇床子素(抗骨质疏松活性)为例,MetabFlow揭示其在大鼠、小鼠及人体内形成15种直接代谢物,其中6种为体内特有,5种为体外特有(均由毛霉AS 3.3450催化)。活性代谢物(E)-3-[2-羟基-4-甲氧基-3-(3-甲基丁-2-烯基)苯基]丙-2-烯酸在骨质疏松模型大鼠血浆中被检测,佐证其药效关联性。另一案例葫芦素D(抗癌活性)展示双层代谢网络,既作为葫芦素B水解产物,又通过脱氧、谷胱甘肽结合等反应生成5种下游代谢物(图4B)。
本研究通过MetabFlow数据库实现了外源性NPs代谢反应的系统集成与可视化分析,其结构化网络与未索引化合物收录填补了现有资源空白。该平台不仅支持代谢机制阐释与活性代谢物发现,还为药物设计中的代谢预测提供数据基础。未来通过用户贡献机制与年度更新,有望进一步拓展其在精准医学与微生物-宿主互作研究中的应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号