小鼠基因表达数据库(GXD)2026更新:多组学整合与细胞类型特异性表达检索新突破

《Nucleic Acids Research》:The mouse Gene Expression Database (GXD): 2026 update

【字体: 时间:2025年11月21日 来源:Nucleic Acids Research 13.1

编辑推荐:

  本文推荐研究人员关注《Nucleic Acids Research》数据库专刊最新收录的"小鼠基因表达数据库(GXD)2026更新"。该研究针对发育生物学研究中基因表达数据分散、标准化不足的问题,通过系统整合RNA原位杂交、免疫组化、RNA-Seq等多组学数据,建立了包含>2百万条表达记录、>34000篇文献的权威资源。特别值得关注的是新开发的表达谱检索工具支持细胞类型特异性查询,利用Cell Ontology和发育解剖学本体论实现精准检索,为人类发育与疾病机制研究提供了不可或缺的数据支撑。

  
在发育生物学和疾病机制研究领域,科学家们一直面临着一个核心挑战:如何系统整合来自不同实验技术的基因表达数据,从而全面揭示基因在时空维度上的表达规律。传统的小鼠基因表达研究产生了海量的原位杂交、免疫组化等数据,但这些数据分散在不同文献中,缺乏统一标准化描述,使得跨研究比较和数据挖掘变得异常困难。随着RNA-Seq等高通量技术的普及,数据整合的复杂性进一步加剧,研究人员急需一个能够无缝整合多源表达数据的权威平台。
正是在这样的背景下,Jackson Laboratory的研究团队在《Nucleic Acids Research》上发表了小鼠基因表达数据库(Gene Expression Database, GXD)的最新进展。作为Mouse Genome Informatics(MGI)资源体系的关键组成部分,GXD经过25年的持续发展,已成为发育生物学领域最具影响力的数据库之一。
本研究的关键技术方法主要包括:基于文献索引的系统性数据采集(覆盖>34000篇参考文献),利用发育解剖学本体和细胞本体论(Cell Ontology)的标准化注释,从EMBL-EBI Expression Atlas导入的RNA-Seq数据整合处理(包括TPM值标准化和表达水平分档),以及采用随机森林(Random Forest)机器学习算法对公共数据库中的相关实验进行自动筛选。
数据内容与采集进展
通过系统性文献调研,GXD建立了包含>34000篇参考文献的索引,涵盖>17000个基因。数据库目前包含>220万条经典表达结果注释,覆盖18000个独特的阶段特异性解剖结构,并配有约50万张实验图像。特别值得注意的是,GXD开始使用细胞本体论作为表达模式的标准化描述符,实现了组织与细胞类型注释的模块化处理。
RNA-Seq表达数据
GXD成功整合了来自EMBL-EBI Expression Atlas的批量RNA-Seq数据,涵盖96个实验项目的2127个样本。研究人员开发了特殊的数据处理流程,对TPM(Transcripts Per Million)文件进行分位数归一化处理,并将表达水平分为高、中、低和低于 cutoff 四个等级,从而实现了与经典表达数据的无缝整合。
公共RNA-Seq和微阵列实验索引
针对GEO(Gene Expression Omnibus)和ArrayExpress中存在的术语异质性问题,GXD建立了经过人工校订的元数据索引,包含约10500个实验的220000个注释样本。创新性地引入了RNA-Seq方法类型标注(批量、单细胞、空间),使研究人员能够精准定位所需数据类型。
用户界面增强功能
新开发的表达谱检索(Expression Profile Search)工具支持经典表达数据和RNA-Seq数据两种模式,允许用户根据解剖结构和发育阶段(Theiler阶段)组合查询基因表达模式。在RNA-Seq模式下,新增的热图(Heat Map)选项卡集成了Broad研究所开发的Morpheus可视化工具,支持层次聚类和邻居分析等高级功能。
新细胞本体论浏览器
细胞本体论浏览器(Cell Ontology Browser)提供了探索细胞类型分类层次和检索相关表达数据的全新途径。用户可以通过文本搜索或本体术语导航查找特定细胞类型,并直接获取与之相关的所有表达注释结果。
GXD 2026更新代表了基因表达数据库发展的重要里程碑。通过多组学数据整合、标准化注释体系以及智能化检索工具的协同创新,该研究解决了发育生物学数据整合中的关键瓶颈问题。特别是细胞类型特异性表达检索功能的实现,为精准解析发育过程中的分子事件提供了强大工具。作为国际小鼠基因组信息学资源的重要组成部分,GXD不仅为基础发育生物学研究提供支撑,更为人类疾病机制研究提供了宝贵的跨物种比较平台。随着单细胞RNA-Seq数据整合计划的推进,GXD有望在单细胞分辨率上进一步拓展其应用价值,推动发育生物学和精准医学研究的深入发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号