编辑推荐:
社会科学研究常面临多源数据可比性难题,尤其中小尺度地域及跨领域变量整合。为此,研究人员构建西班牙 municipalities 1900 年至今含 45 个地理、气候、水文及人口经济变量的 HISTORECO 数据库,融合 17 类数据源,为气候变化、人口结构等研究提供时空高分辨率数据支撑。
在社会科学领域,跨学科研究常受制于多源数据的时空可比性与整合难题。尤其对于国家内部中小尺度地域(如 municipality)的长期研究,不同领域变量(气候、地理、经济等)的碎片化分布严重制约了对复杂社会问题的深入分析。例如,欧盟统计局(Eurostat)等机构的数据多停留在国家或省级层面(如 NUTS 2/3),缺乏对更小行政单元的覆盖,且长期数据的跨领域整合极为有限。这种数据缺口使得研究者难以从多维度解析诸如气候变化对地方经济的影响、人口分布与地理环境的关联等重要议题。
为填补这一空白,西班牙萨拉戈萨大学(University of Zaragoza)、阿尔卡拉大学(Universidad de Alcalá)等机构的研究团队开展了一项具有突破性的研究。他们构建了 HISTORECO 数据库,首次整合了西班牙全部 municipalities 1900 年至 2021 年的 45 个跨领域变量(含 64 个独立列),涵盖气候(如降水、温度、SPEI 干旱指数1)、地理(如海拔、距海岸距离)、水文(如水库容量、河流流域)及人口经济(如人口数量、土地利用面积)等多个维度。该研究成果发表于《Scientific Data》,为全球范围内中小尺度跨学科研究提供了重要的数据范式。
研究团队采用了多技术融合的方法体系。首先基于西班牙国家地理研究所(IGN)的 municipality 多边形数据(8,205 个对象),通过 GIS 空间分析工具(QGIS)与编程语言(R、Python)实现数据的时空降尺度与同质化。气候数据(如 CRU TS version 4.05 的降水、温度数据)通过 “区域统计”(zonal statistics)算法从 0.5°×0.5° 栅格数据 downscale 至 municipal 级别,利用加权平均公式 Cm=∑i,j∈RcAi,jAi,jm∑i,j∈Rc(Ai,jAi,jm?rc,i,j) 计算每个行政区的气候指标。地理变量(如距马德里距离、海拔)通过提取 municipal 质心坐标,结合 QGIS 的 “最近枢纽距离” 算法测算。土地利用与水文变量则通过叠加历史灌溉数据集(HID)、全球大坝数据库(GDW)等多源矢量数据,利用空间交集(intersect)与邻接矩阵(contiguity matrix)分析相邻区域的资源分布。
研究结果
气候变量的长时序特征
研究揭示了西班牙百年气候演变的空间异质性。总降水(pp)与平均温度(t_average)的年代际变化显示,南部地中海气候区干旱化趋势显著,SPEI 干旱指数1在 1980-2020 年期间下降约 0.3 mm / 十年。降水在植被生长期(4-10 月)的累积量(grow_period_pp)与霜冻日数(frost_days)呈现明显的南北梯度,北部海洋性气候区的生长期降水比南部高 40%-60%,而霜冻日数则减少 50% 以上。柯本气候分类(K?ppen’s climate classification)的虚拟变量显示,85% 的 municipalities 属于地中海气候,其中 12% 为夏季凉爽型地中海气候,反映了地形对微气候的塑造作用。
地理与水文变量的空间关联
地理变量分析表明,距海岸距离(to_coast_km)与经济发展水平呈负相关,距马德里 50 km 内的 municipalities 人口密度比偏远地区高 2.3 倍。海拔(altitude)与地形粗糙度(ruggedness)显著影响土地利用模式,高海拔山区的牧场面积(pastures)占比达 35%,而低海拔平原的灌溉面积(irrigated)占比超 60%。水文数据显示,水库容量(reservoir_volume)在 1950-2020 年增长 3 倍,主要用于灌溉(Vol_Irrigation)和电力(Vol_Electricity),其中埃布罗河流域的水库承担了全国 45% 的农业用水。
人口经济变量的动态演变
人口数据(population)显示,1950-2020 年西班牙 rural municipalities(<2,000 人)数量减少 28%,而 urban municipalities(>10,000 人)增加 17%,呈现明显的人口向城市聚集趋势。殖民城镇(colonization towns)的虚拟变量表明,曾设立殖民点的 municipalities 人口增长率比无殖民点地区高 12%,凸显历史政策对人口分布的长期影响。交通基础设施(如高铁 HSR、伊比利亚轨距铁路)的可达性分析显示,距高铁站 25 km 内的 municipalities 经济增长率比偏远地区高 1.8 个百分点。
结论与意义
HISTORECO 数据库通过整合多源异构数据,构建了西班牙百年社会 - 环境系统演变的高分辨率时空档案。其核心价值体现在:① 突破传统数据的尺度限制,为 municipality 级别的因果推断提供可能,例如验证灌溉农业对人口留存的影响54;② 跨领域变量的集成设计支持多学科交叉研究,如气候 - 经济交互作用、地理 - 人口空间关联等;③ 方法论层面创新了历史数据的数字化重建路径,其 GIS - 统计 - 编程融合的技术框架可为全球同类研究提供参考。
该研究不仅填补了西班牙地方史研究的数据空白,更对全球变化研究具有普适意义。例如,其构建的干旱指数与土地利用数据集可用于验证地中海地区 “干热化” 对农业系统的胁迫效应,而人口 - 交通关联分析则为发展中国家的城镇化政策提供了历史镜鉴。未来,随着开放数据共享平台(
https://historeco.unizar.es)的持续更新,HISTORECO 有望成为全球社会科学领域最具影响力的区域数据库之一。