基于本体框架的欧洲土壤生物多样性数据整合:EUdaphobase分类本体(EUTaxO)的构建与应用

【字体: 时间:2025年08月09日 来源:Ecological Genetics and Genomics CS1.8

编辑推荐:

  本研究针对土壤生物多样性数据分散、缺乏标准化整合的问题,开发了EUdaphobase分类本体(EUTaxO),通过自动化流程与Edaphobase数据库同步更新,实现了土壤无脊椎动物分类系统的语义化建模。该研究遵循FAIR原则,为功能性状数据库整合提供核心架构,推动土壤生态功能评估的跨尺度研究。

  

土壤是地球生命支持系统的核心,其生物多样性直接关系到碳循环、养分转化等关键生态过程。然而,当前土壤生物数据存在"信息孤岛"现象:分类系统更新滞后、功能性状数据分散、观测记录与分子数据割裂。这种碎片化现状严重阻碍了科学家评估土壤生物对气候变化的响应能力,也制约着"欧盟土壤使命"等政策的科学基础建设。

西班牙马拉加大学(University of Málaga, ETSI Informática)联合欧洲多国团队在《Ecological Genetics and Genomics》发表研究,创新性地将语义网技术引入土壤生态学领域。研究人员开发了EUdaphobase分类本体(EUTaxO),这是首个专为土壤无脊椎动物设计的标准化分类框架。通过构建自动化CI/CD管道,该本体能实时同步Edaphobase数据库的专家分类修订,目前已整合115,000个分类单元,涵盖动物界(Animalia)、细菌界(Bacteria)、色素界(Chromista)和真菌界(Fungi)四大类群。

关键技术包括:(1)基于OWL2的本体建模,复用Darwin Core术语;(2)Edaphobase API数据抽取与RDF转换;(3)采用OOPS!和FOOPS!进行质量评估;(4)通过W3C永久URL和LOV注册实现FAIR化;(5)与Chilopoda解剖本体(ChilAO)和土壤食物网本体(SFWO)的语义关联。

研究结果显示:

  1. 本体模型设计:创建包含43,062个动物分类单元的层次结构,定义belongsTo等4种对象属性和acceptedNameUsage等10种数据属性,解决传统数据库无法表达分类单元动态演变关系的问题。

  2. 自动化更新机制:每月同步的流水线可捕获分类修订,如节肢动物门(Arthropoda)命名从von Siebold 1848更新为Gravenhorst 1843的学术争议。

  3. 跨本体互操作性:通过owl:sameAs实现与ChilAO的解剖术语、SFWO的营养级关系的三元组链接,示例显示蜈蚣类(Chilopoda)在三个本体中的术语映射。

  4. 质量验证:经FOOPS!评估达到91%的FAIR合规率,仅残留1项次要缺陷(P20注释误用)。

该研究的突破性在于将传统上依赖专家经验的分类学转化为机器可读的知识图谱。以Vandeleumatidae科为例,本体能自动反映2021-2022年间该科分类框架的三种典型变更:发表年份修正、分类重组和新分类单元添加。这种动态性对追踪土壤生物群落演替至关重要,例如通过关联BETSI和EcoTaxonomy等性状数据库,未来可量化耕作方式对土壤食物网功能群组成的影响。

讨论部分强调,EUTaxO不同于静态的NCBI Taxonomy,其创新价值体现在:(1)专为土壤生物定制的属性体系,如brackets标记命名修订状态;(2)放弃传统Darwin Core的字符串属性,采用对象属性直接链接分类节点;(3)通过SKOS词汇表对接GBIF、WoRMS等外部数据库,已建立55,000条跨库链接。研究团队建议将本体应用于历史文献挖掘,如整合BIOfid项目的德语解剖学术语,以激活20世纪初Kraepelin等学者的观测数据。

这项研究为《欧洲绿色新政》的土壤健康监测提供了核心语义基础设施,其方法论对微生物组学、古生态学等领域的分类数据整合具有示范意义。随着欧盟土壤观测网(EU Soil Observatory)的推进,这种本体驱动的数据融合模式有望成为生态大数据管理的标准范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号