应用多维土壤数据协调框架构建安大略省土壤信息系统(OSIS):推动农业与生态可持续发展的数据整合创新

【字体: 时间:2025年09月25日 来源:Canadian Journal of Soil Science 1.5

编辑推荐:

  本文系统阐述了安大略省土壤信息系统(OSIS)的构建方法与科学价值,通过建立端到端多维土壤数据协调框架(SDHM),整合了固定深度(fixed depth)、表层土(topsoil)、剖面(profile)和泥炭地(peatland)四种数据类型,涵盖超1.4万个观测点。研究采用最小纳入标准与地理哈希标识(SSID)技术,利用KNIME、R和SQL等工具实现数据清洗、深度协调(如质量保持样条插值)与数据库集成,最终形成包含6335个站点、2.8万余土层的高质量土壤数据库。该研究不仅解决了历史数据碎片化与更新滞后(如国家土壤剖面数据库NPD截至2011年)问题,还为数字土壤评估(DSA)、碳封存研究和生态系统服务模拟提供了可靠数据基础,对农业可持续发展、土壤健康评价(如土壤有机碳SOC、pH、容重BD等指标)及政策制定具有重要支撑意义。

  

引言:土壤数据在数字时代的关键作用

土壤作为农业系统、生物多样性、碳固存、生态系统服务和整体可持续性的基础,对人类福祉具有深远影响。然而,由于数据收集方法的多样性和土壤数据管理的碎片化实践,从不同数据集中创建统一的土壤数据库变得复杂。在加拿大安大略省,不同机构的数据分散性阻碍了这一重要土壤数据在时空分析中的获取与使用。国家土壤剖面数据库(NPD)的最新更新仍停留在2011年,凸显了建立省级集中式数据仓库以系统访问和分析土壤信息的迫切需求。

材料与方法:多维数据协调框架的设计与实施

研究区域与数据来源覆盖安大略省地理范围(纬度41.67656至56.85937,经度-95.15367至-74.32011),整合了四类数据体裁:固定深度(2020年和2011年收集)、剖面(1952–2011年)、表层土(2019年)和泥炭地(1999–2011年)。数据通过大学与政府部门间的谅解备忘录获取,部分涉及共享限制。OSIS数据库以数据源和数据体裁为核心组件,每个数据源配有唯一ID,结合数据源名称与体裁类别(1-剖面,2-固定深度,3-表层土,4-泥炭地)。空间覆盖分为国家级、省级、县级和本地级。

元数据结构与集成通过统一变量标准实现,例如将“土壤层次”和“样本”统一标注为“层”,确保跨数据体裁的一致性。土壤数据超循环模型(SDHM)作为协调框架核心,分数据筛选与数据策管两步实施。筛选标准包括地理编码(经纬度)、野外信息与实验室分析数据(如pH、SOC、颗粒大小分布)。策管过程包括标记(使用SSID和SPLP唯一标识)、数据整理(清洗与标准化)、协调(如深度协调)和链接(集成至SQLite关系数据库)。

标记阶段采用12字符地理哈希(SSID)作为站点唯一标识,基于经纬度生成,支持多维数据查询与跟踪。数据整理侧重解决不一致性,如利用植被属性补充土地利用覆盖(LULC)信息。协调阶段通过质量保持等面积样条函数在六种深度间隔(0–5、5–15、15–30、30–60、60–100和100–200 cm)进行深度归一化,并融合数据体裁。链接阶段将处理后的数据存储于SQLite数据库,作为OSIS后端基础。

结果与讨论:数据库构建与多维分析

OSIS数据库初始编译包含14145个站点和41103个土层,经协调后保留6335个唯一站点和28134个土层,其中剖面、表层土和固定深度站点分别为5460、178和697个。缺失值分析显示,仅39%的原始数据在75%缺失阈值下被保留,涉及11种野外特性、11种物理参数和13种化学属性。策略上,需借助pedotransfer函数估计缺失值(如容重BD),或通过数据转换(如pH与pHCaCl2间的回归关系,R2=0.96)填补间隙。

空间维度上,全省采样密度为14站点/1000 km2,但分布不均:南部密度较高(28站点/1000 km2),侧重农业评估;北部稀疏(1站点/1000 km2),以剖面和泥炭地数据为主。深度协调后,数据量随深度增加而减少,0–5 cm层数据略低于5–15 cm层,源于样条插值对数据完整性的要求。协调也引入深度变量缺失问题,原因为记录错误导致的深度重叠,100个站点因此被排除。

数据体裁协调通过SSID实现地理精度管理,首5字符标识大致区域(如“dp”指向安大略南部),后字符细化位置。但高精度SSID可能引发隐私问题,建议缩短至4字符以平衡需求。时间维度上,数据跨越1952–2021年,土壤属性均值随时间与空间变异性变化,例如BD均值为1.23 g cm?3(CV=21.9%),SOC为1.79%(CV较高)。深度插值偶尔产生异常值(如黏粒含量>100%),需后续调整。

土壤类型分析显示,Gleysolic、Luvisolic和Brunisolic土占主导(95%),排水等级以“不良”>“不完全”>“良好”为主。Sankey图揭示数据源、土类和排水间的关联,如Luvisolic土多与不完全排水相关。Catena概念(相同母质、不同景观位置与排水)对解释土壤空间变异性至关重要,尽管未纳入加拿大土壤分类系统(CSSC)。

部署与更新:OSIS数据库的应用与前景

OSIS数据库连接至OSIS门户后端,通过机器学习模型与环境协变量增强土壤信息服务。数据库版本化管理(当前v1),支持持续更新与新数据集集成。作为省级数字土壤评估与制图基础,它同时充当国家级数据协调节点的模板。框架的自动化、可追溯性与互操作性(基于KNIME、R、SQLite)促进跨区域合作,支持农业、环境科学及政策决策。

结论:协调框架的价值与未来方向

研究证实了通过SDHM协调多源、多体裁、多年代土壤数据的可行性。尽管缺失数据导致50%以上损失,但通过pedotransfer函数、库内整理和数据转换策略可部分缓解。SSID系统克服了项目特定命名不一致性,支持遗产与未来数据集集成。工作流驱动的数据策管确保修改可追溯,最小标准与统一元数据提升透明度。集成开源工具增强自动化与质量控制,避免数据碎片化。南部安大略较高采样密度(28站点/1000 km2)为国际对比提供基础,未来应优先重访历史站点以填补时间序列缺口,并采用基于设计的调查协议与标准化管理减少差异。OSIS数据库最终为生态系统功能多维度决策提供科学基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号