BRENDA数据库2026:基于DSMZ数字多样性平台的全球酶功能与代谢核心数据资源升级

《Nucleic Acids Research》:BRENDA in 2026: a Global Core Biodata Resource for functional enzyme and metabolic data within the DSMZ Digital Diversity

【字体: 时间:2025年11月07日 来源:Nucleic Acids Research 13.1

编辑推荐:

  本刊推荐:为应对生命科学领域对高质量生化数据的迫切需求,研究人员对BRENDA酶数据库进行了系统性升级。通过构建知识图谱原型、整合DSMZCellDive细胞系表达数据、开发基因中心搜索界面等创新举措,实现了对112,288种酶、278,840种配体的高效管理。该研究显著提升了数据库的FAIR化程度,为代谢工程、药物开发等研究提供了重要支撑。

  
在当今生命科学研究飞速发展的时代,高通量测序、蛋白质组学、代谢组学等技术的突破性进展,使得科学家们能够以前所未有的深度探索生命的奥秘。然而,海量数据的涌现也带来了新的挑战——如何高效整合、管理和利用这些分散的生化数据,成为制约生命科学发展的关键瓶颈。酶作为生命活动中不可或缺的生物催化剂,其功能数据的系统化管理显得尤为重要。正是在这样的背景下,BRENDA(BRaunschweig ENzyme DAtabase)数据库应运而生,并持续演进成为全球生命科学研究的核心基础设施。
作为最全面的酶功能与配体相互作用数据库,BRENDA近四十年来一直为全球科研人员提供高质量的酶学数据。随着数据量的指数级增长和用户需求的多样化,传统的数据库架构已难以满足现代生命科学研究的需求。特别是在数据整合、互操作性和可视化分析方面,科研人员迫切需要更加智能、高效的数据访问和挖掘工具。为了解决这些问题,来自德国莱布尼茨DSMZ微生物和细胞培养物保藏中心的研究团队对BRENDA数据库进行了全面升级,相关成果发表在《Nucleic Acids Research》期刊上。
本研究主要采用了知识图谱构建技术、SPARQL端点开发、细胞系表达数据整合、代谢通路可视化等关键技术方法。其中,知识图谱基于DSMZ数字多样性本体(D3O)构建,使用R2RML映射和Ontop框架实现;人类细胞系表达数据来源于DSMZCellDive数据库的1000多个人类细胞系RNA-Seq数据;代谢通路分析涉及195个通路的可视化重构。
BRENDA知识图谱
研究人员构建了BRENDA知识图谱原型,通过SPARQL端点(https://sparql.dsmz.de/brenda)提供语义搜索服务。该图谱采用资源描述框架(RDF)存储数据,包含10,798,737个RDF三元组,覆盖酶类、配体、代谢通路等多个实体类型。知识图谱实现了与UniProt、Gene Ontology、NCBI Taxonomy等核心数据库的互联,支持复杂的数据查询和整合分析。如图1所示,用户可以通过SPARQL查询获取酶反应相关的底物、产物、化合物标识符(InChI)等结构化信息。
最高表达人类细胞系
通过整合DSMZCellDive的基因表达数据,BRENDA现在能够在酶摘要页面展示表达特定酶基因的最高表达人类细胞系。该功能以彩色条形图形式呈现,根据不同肿瘤类型进行颜色编码,并提供到DSMZCellDive、UniProtKB、NCBI Gene和Ensembl的交叉链接。如图2所示,对于EC 2.7.10.2等酶类,研究人员可以快速识别适合特定酶功能研究的最佳细胞系模型。
基因搜索
新开发的基因搜索界面(https://brenda-enzymes.org/genes.php)支持通过基因符号、全名、生物体名称以及多个公共数据库标识符进行检索。这一功能简化了从基因到酶功能数据的访问流程,为基因中心的研究方法提供了有力支持。
通路摘要页面
新设计的通路摘要页面为195个代谢通路提供了结构化展示平台,包含通路图谱、酶列表、代谢物信息和通路间链接四个标签页。如图3所示,代谢物标签页详细列出了通路中涉及的化合物结构式、分子式、InChI和InChIKey等关键信息,支持数据下载和跨数据库链接。
数据内容更新
截至2025.1版本,BRENDA包含5,822,081个数据点,覆盖112,288种酶、278,840种配体和15335种生物体。自2021年以来,新增614个EC编号类别,其中480个包含新整理的手动注释数据。人工注释参考文献约16,000篇,更新4422个EC类别。通路集合扩展到195个代谢图谱,包含12,016个节点,代表2,110种不同酶、2,338种代谢物和2,892个反应。
用户行为分析
通过对用户访问模式的分析发现,全局搜索(43.7%)和酶摘要页面(28.3%)是最常用的功能模块。引用分析显示,BRENDA主要被用于功能参数查询、基因组尺度代谢建模、通量平衡分析和机器学习应用。用户反馈强调了对化学信息学集成(SMILES表示法)、现代化API接口和改进搜索界面可用性的需求。
本研究通过系统性升级BRENDA数据库,显著提升了酶功能数据的可访问性、互操作性和可视化分析能力。知识图谱的引入为复杂生物学数据的语义集成和智能查询提供了新范式,细胞系表达数据的整合为实验研究提供了实用的模型选择工具,而通路分析功能的增强则支持了系统生物学研究的深入开展。这些改进不仅巩固了BRENDA作为ELIXIR核心数据资源和全球核心生物数据资源的地位,更重要的是为生命科学研究社区提供了更加完善的数据基础设施,将有力推动代谢工程、药物开发、进化生物学等领域的创新发现。随着DSMZ数字多样性平台的持续发展,BRENDA有望在未来的生命科学研究中发挥更加重要的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号