土壤健康指标与社会人口经济背景:欧盟相关数据集

《Data》:Soil Health Descriptors and Socio-Demographic-Economic Context: A Dataset for the European Union

【字体: 时间:2026年01月12日 来源:Data 2

编辑推荐:

  欧盟NUTS2层级整合社会经济、土地利用及土壤健康多维度数据集,涵盖侵蚀、压实、盐渍化等6项土壤退化指标及气候风险,支持土壤退化驱动因素的多变量分析及政策制定。

  

摘要

土壤退化是欧盟面临的一个紧迫问题,影响着所有主要的土地利用类型,包括农业、森林和城市地区。现有的研究经常能够识别出导致土壤退化的因素,但大规模、全面的数据集却非常有限。这个数据集是在NUTS2(欧洲区域分类系统,第二级)层面编制的,整合了2005年至2023年间的社会人口因素、土地利用变化以及土壤健康状况的描述指标。它包含了人口动态、物质匮乏、土地所有权以及土壤健康挑战(如侵蚀、压实、盐碱化、土壤有机碳含量和工业污染)等变量。所使用的土壤描述指标来源于ESDAC等次级地理空间数据集,并通过GIS技术进行处理。该数据集专为空间规划、农业和环境研究设计,有助于进行多变量分析和回归分析,以探究社会经济因素对土壤健康的影响。通过整合来自多个来源的多样化描述指标,它为理解土壤退化和支持基于证据的政策制定提供了宝贵的资源。
数据集: https://maps.bonares.de/mapapps/resources/apps/bonares/index.html?lang=en&mid=25f6ea0b-3f54-4335-8017-d17874b41c0d(访问日期:2025年3月27日) 数据集许可: CC-BY

1. 摘要

尽管现有研究已经确定了导致土壤退化的因素,但在欧洲范围内整合这些因素的全面数据集仍然很少。例如,土地使用者的特征比土地所有者的特征更为重要[1,2]。因此,我们同时纳入了土地所有者和土地使用者的数据,假设不同比例的土地使用权(如租赁土地、私有土地、公有土地)所在的地区,其土壤健康状况可能存在差异。此外,社会人口条件(包括人口密度、人口变化率和经济贫困程度)也被证实是土壤退化的驱动因素[2,3]。因此,我们加入了人口动态和严重物质匮乏的描述指标,后者比人均GDP更能直接反映地区的经济压力。严重物质匮乏是衡量地区经济状况的更准确指标。气候风险类别是土壤退化的一个后果。
该数据集的目的是提供一个集成的、可用于分析的资源,以研究这些地区社会经济条件与土壤健康之间的关系。通过将ESDAC中的土壤健康描述指标与一致NUTS2空间单元的社会人口和土地利用数据相结合,该数据集填补了当前缺乏的、适合多变量区域分析的全面、统一数据集的空白。该数据集的编制旨在支持关于土壤退化驱动因素的学术研究,以及根据欧盟土壤任务框架实施的基于证据的政策。我们选择NUTS2级别作为数据集的划分标准,因为它代表了欧盟成员国的行政单位,从而为分析提供了统一的尺度。图1展示了我们数据集中使用的NUTS2级别的区域覆盖范围。
图1. 欧洲范围内的NUTS2级别概览。
该数据集整合了六个主要的土壤健康描述指标,涵盖了与欧洲土壤政策相关的关键退化过程:1. 土壤侵蚀性;2. 压实敏感性;3. 农业区域的盐碱化风险;4. 土壤有机碳饱和能力(表明碳封存潜力);5. 土壤生物功能的潜在挑战(包括对土壤微生物的风险);6. 基于点源重金属浓度的工业污染风险。此外,还包含了两个气候变化风险指标:干旱风险(干旱指数)和河流洪水风险,以帮助理解土壤健康面临的挑战。这些指标的选择基于它们与欧盟土壤任务和共同农业政策的政策相关性、作为ESDAC提供的泛欧洲统一数据集的可用性,以及文献中记录的它们与社会经济驱动因素之间的关联[1,2,3]。所有土壤健康描述指标都是通过基于GIS的统计方法从ESDAC地理空间产品中提取的,并汇总到NUTS2行政单元,为研究地区社会经济条件与土壤健康状况之间的关系提供了标准化的分析框架。

2. 数据描述

该数据集包含了欧盟所有NUTS2区域(图1)的原始数据。对于某些NUTS2区域,参考年份已经发生变化,因此数据包含了这些区域停止运行的年份之前的数据。
数据集包括以下变量,这些变量在表1表2表3中进行了整理,以便更好地查看:
表1. 欧洲的土地利用描述指标。
表2. 社会人口和经济描述指标。
表3. 土壤健康描述指标和气候变化风险。
每个土壤变量都是通过GIS框架中的分区统计方法从栅格数据集中提取的,这些栅格数据应用于NUTS3多边形。土壤健康描述指标是按区域平均值计算得出的,然后根据面积权重汇总到NUTS2级别。所有土壤健康描述指标的元数据(包括单位和来源)都包含在补充文件中。数据集的元数据遵循BonaRes存储库的元数据规范[20],并存储在该存储库中,以确保符合土壤和农业数据的特定领域标准。数据集以CSV格式提供。本研究中使用的土壤数据属于二次数据,来源于ESDAC提供的公开地理空间数据集,这些数据集基于卫星观测和建模的环境描述指标,具有泛欧洲的统一性。每个描述指标的定义和数据来源都包含在表4中。
表4. 土壤描述指标的定义和来源。
此外,本研究中使用的土壤工业污染数据来源于ESDAC的土壤污染风险数据集,该数据集根据超过欧洲环境阈值的污染物的存在和浓度来评估区域的敏感性。关键描述指标包括重金属污染物(如镉、铅、汞、锌)、持久性有机污染物(如多环芳烃和多氯联苯)、过量氮和磷输入导致的营养过剩,以及残留农药浓度。
通过将异构的ESDAC产品转换为统一的NUTS2级别土壤健康描述指标,并将其与社会经济数据整合,该数据集扩展了现有欧洲土壤数据资源的分析潜力。尽管这些土壤健康描述指标来源于栅格数据,但通过系统的处理和整合,我们实现了这些指标的统一,并与来自多个来源(例如Eurostat)的社会经济和土地利用变量进行了结合。通过这种整合,我们旨在实现土壤健康描述指标与社会经济数据之间的区域比较,并支持多变量和基于回归的分析,而无需额外的GIS预处理,从而提高了数据的可用性,并促进了跨学科研究和基于证据的政策制定。
在解释该数据集时,需要考虑一些潜在的不确定性。例如,将基于栅格的土壤健康描述指标按行政单位进行空间聚合可能会在局部尺度上产生轻微的变化。此外,这些描述指标来自不同的参考年份,这可能会在比较分析中引入轻微的时间不一致性。另外,土壤变量来源于二次的、统一化的、基于模型的数据集,这些数据集本质上反映了与输入数据和空间概括相关的假设,在进一步分析时应予以考虑。

3. 方法

为了获得本研究所需的相关数据和地图,进行了全面的GIS分析。首先,从已建立的来源(包括ESDAC和Copernicus)获取输入数据,并将其几何投影到ETRS89(1989年欧洲陆地参考系统)投影系统中,以确保每张图像的兼容性。然后,利用GIS中的分区统计功能从数据集中提取关键信息,如“土壤生物功能”(Soil_bio_func)、“盐碱化”、“污染”、“侵蚀”和“有机碳潜力”等属性。这些属性被映射到NUTS3多边形上,形成了详细的数据表。
所有空间分析均使用ArcGIS Pro 3.3进行,采用了内置的空间分析工具箱和ArcGIS Pro Python环境中的Python(版本3.10.4)脚本。在此过程中,使用“mean”函数对投影输入地图中的像素数据进行聚合,并根据NUTS代码和地点名称将结果值分配给每个NUTS多边形。输入层中的NoData值没有被排除在分区统计计算之外。平均值仅计算与每个NUTS3多边形相交的有效栅格单元。栅格层在其原始空间分辨率下进行处理;在提取之前没有进行重采样,以避免引入额外的空间不确定性。对于每个栅格数据集,分别进行分区统计,然后使用面积加权平均法汇总到NUTS2区域。在汇总过程中,使用NUTS3几何形状对应的NUTS3边界进行聚合。对于已停止运行的NUTS区域,保留了它们正式停止运行的年份之前的数据,且在汇总之前没有对NUTS3边界进行追溯性统一处理,以保持空间单元和源数据之间的时间一致性。此外,形状面积和长度以公顷(ha)为单位计算,并从最终数据表中排除,因为它们对研究范围内的数据没有直接影响。
汇总完成后,对结果进行了质量控制,包括在栅格提取后系统地检查缺失和NoData值,在NUTS3和NUTS2级别进行视觉和统计异常值筛查,并通过将汇总值与基础栅格模式进行比较来验证分区统计结果。还进行了时间一致性控制,以识别参考年份和区域之间的不合理变化。任何异常值在纳入最终数据集之前都经过了与源数据和元数据的交叉验证。

补充材料

以下支持信息可以在以下链接下载:https://www.mdpi.com/article/10.3390/data11010011/s1:表S1:社会人口-经济-土地;表S2:土地所有权;表S3:数据代码。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号