MouseOmics:首个整合多组学与金属组学的小鼠生物学数据库

《Nucleic Acids Research》:MouseOmics: a multi-omics database for mouse biological study

【字体: 时间:2025年10月22日 来源:Nucleic Acids Research 13.1

编辑推荐:

  本研究针对小鼠模型缺乏系统性多组学整合数据库的问题,开发了MouseOmics数据库。该研究整合了21个基因组、584个转录组样本、285个蛋白组样本、143个代谢组样本、296个金属组样本及3个变异组数据,嵌入了MISAweb、同源基因分析和功能富集等工具,首次系统收录金属组学数据并实现跨组学关联检索。该数据库为小鼠生命周期研究提供了多维数据支持,发表于《Nucleic Acids Research》2025年数据库专刊。

  
小鼠作为医学和生命科学领域的关键模型生物,在发育生物学和多组学研究中具有不可替代的地位。然而,随着测序技术的飞速发展,海量的小鼠基因组、转录组、蛋白组、代谢组数据分散在不同数据库中,缺乏系统性整合。尤其金属组学(metallomics)——这一研究生物体内金属元素含量、形态分布和功能的新兴领域,尚未被现有数据库有效涵盖。传统数据库如MGD、GXD等虽各具特色,但架构局限难以满足多组学整合分析需求,且缺乏跨生命周期的多维数据关联。这种数据碎片化现状严重阻碍了科研人员对小鼠生物学机制的系统性探索。
为解决这一瓶颈,浙江大学等单位的研究团队在《Nucleic Acids Research》发表了MouseOmics数据库。该研究通过数据挖掘和集成分析,构建了涵盖5种Mus属物种、21个基因组的高质量组装数据,收录了跨越不同发育阶段的584个转录组样本、285个蛋白组样本、143个代谢组样本、296个金属组样本及52个近交系的变异组数据。研究人员采用InterProScan、DIAMOND Blastp、eggNOG-mapper等工具对107万条转录本进行功能注释,通过MCScanX识别了67,967个同源区块,并开发了基于D3.js的动态可视化界面。
关键技术方法包括:从公共数据库获取21个小鼠基因组的新发布高质量组装;通过数据挖掘流程从已发表文献提取多组学数据;使用InterProScan、DIAMOND、eggNOG-mapper进行基因功能注释;采用MCScanX进行同源区块分析;基于LAMP(Linux/Apache/MySQL/PHP)系统搭建数据库架构,集成DESeq2、JBrowse2等分析工具。
基因组模块实现多维数据整合
研究团队对21个小鼠基因组进行了系统注释,包括13个实验室品系和4个亚种(日本野生鼠、东南亚家鼠等)。每个基因页面均整合了基本信息、基因组定位以及跨转录组和蛋白组的表达谱数据。例如slc11a2基因(编码二价金属转运蛋白DMT1)的页面不仅显示其基因组坐标,还关联了在不同组织中的mRNA和蛋白表达水平,用户可通过超链接直接跳转至表达详情页面。
转录组与蛋白组模块支持差异分析
数据库收录的14个转录组项目包含2254个生物学重复,蛋白组项目包含1161个重复。用户可通过"基因表达"单元输入目标基因列表,获取交互式热图;"配对比较"功能则支持任意两个样本间的差异表达分析,自动生成包含调整P值和差异倍数的DEG(差异表达基因)列表,并可视化火山图和热图。这种设计使得研究人员能够快速识别不同发育阶段或组织间的表达调控模式。
金属组学模块填补数据空白
研究特别突出了金属组学数据的创新整合。数据库收录的6个金属组项目涵盖1920个重复测量值,用户可按组织类型查询离子浓度(如Fe、Zn等)。点击离子符号可生成跨项目的浓度变化趋势图,直观展示金属元素在不同生理状态下的动态变化。以铁离子(Fe)为例,其浓度谱揭示了金属稳态随年龄变化的规律,为研究金属代谢异常相关疾病提供了数据基础。
同源分析与工具集成增强功能拓展
通过MISAweb模块,用户可快速识别微卫星DNA;同源查看器则支持任意两个基因组间的染色体共线性可视化,以Circos图形式展示753万个同源基因对的分布。此外,团队专门开发了InterPro、GO(Gene Ontology)和Pathway富集分析工具,用户输入蛋白ID列表即可获得基于超几何检验的富集结果,显著提升了功能注释的便捷性。
研究结论表明,MouseOmics是首个系统整合六种组学数据类型的小鼠数据库,其独特价值体现在三方面:首次实现金属组学与多组学数据的交叉关联;覆盖从胚胎期到衰老期的全生命周期数据;通过同源比较揭示了Mus属物种的进化分歧。与现有数据库相比,其架构设计支持单细胞转录组、宏基因组等新型数据的持续扩展。
讨论部分强调,金属组学与其他组学的整合将有助于阐明金属元素失衡对转运蛋白、代谢通路的连锁影响。未来计划开发跨组学关联分析、蛋白互作网络等工具,并逐步纳入单细胞测序和泛基因组数据。该数据库通过https://www.varnatech.cn/MouseOmics开放访问,将为小鼠模型研究提供重要的基础设施支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号