土地利用和土地覆盖变化(LUCC)在长期内显著改变了地球表面(Roberts, 2019; Ellis et al., 2021),对区域和全球气候及陆地生态系统产生了重大影响(Stephens et al., 2019; Liu et al., 2022; Friedlingstein et al., 2023)。自工业革命以来,全球约42%-68%的土地表面受到了人类土地利用活动的影响(Hurtt et al., 2006)。作为最重要的土地利用类型之一,农田在过去300年里大幅扩张,其全球占比从2%增加到11%(Goldewijk, 2017)。这种变化对土壤健康、生物多样性、碳平衡和气候变化具有深远影响(Outhwaite et al., 2022; Wang et al., 2022; Friedlingstein et al., 2023)。重建长期且准确的农田变化对于理解过去的气候变化、碳排放以及人类活动的生态影响至关重要(Potapov et al., 2022; Huang et al., 2024)。
自1990年以来,包括“过去全球变化”(PAGES)项目、“国际地球-生物圈计划”(IGBP)和“全球土地项目”(GLP)在内的多个全球项目共同推动了历史LUCC的定量重建,产生了多个著名的全球历史土地利用数据集,例如全新世时期的人为土地利用估算数据(HYDE)(Klein Goldewijk et al., 2011; Goldewijk, 2017)、1700年至1992年的全球农田和牧场数据(SAGE)(Ramankutty and Foley, 1999; Ramankutty, 2012)、过去千年的全球LUCC数据(PJ)(Pongratz et al., 2008)以及前工业时代的LUCC情景(KK10)(Kaplan and Krumhardt, 2011)。这些数据集被广泛用于长期全球变化研究(Kaplan et al., 2011; Koch et al., 2019; Ellis et al., 2021)。然而,在将全球数据集应用于区域或地方尺度时需要谨慎。像SAGE和HYDE这样的全球数据集依赖于在州或国家层面汇总的土地利用/土地覆盖清查数据,其农田估算结果与欧洲(Kaplan et al., 2017)、巴西(Leite et al., 2012)和印度(Moulds et al., 2018)等地区的区域研究存在显著差异。对中国长期农田数据的评估也表明,HYDE、SAGE和KK10的重建结果无法准确反映该国的历史事实与土地利用过程(Fang et al., 2020; He et al., 2023; Wang et al., 2024)。
中国东北地区是中国最重要的粮食生产基地之一,占全国粮食产量的四分之一以上(国家统计局,2024年)。该地区的农业历史可追溯至约300年前(He et al., 2023)。农业扩张导致自然植被覆盖度大幅减少,进而加剧了土壤侵蚀(Xie et al., 2019),并导致土壤碳和氮含量急剧下降(Ge et al., 2008; Liu et al., 2024)。然而,SAGE和HYDE的数据未能准确反映过去300年中国东北地区的实际农田开发情况(Li et al., 2010; Zhao et al., 2022)。因此,准确重建农田分布至关重要。叶等人(2009)利用历史文献和多源数据转换模型重建了过去300年的县级农田比例数据,贾等人(2024)进一步更新和扩展了这项工作。但这些数据集仅表示县级农田面积,而非网格内农田的精确空间分布,这限制了其在研究土地利用变化对生态和气候影响方面的应用。此外,现有的少数网格化数据集通常缺乏连续的历史序列(Zhang et al., 2015; Zhang et al., 2017)。因此,将县级农田比例转化为高分辨率、空间明确的地图是下一步的关键。
为实现这一目标,通常采用基于适宜性的空间分配模型(Yang et al., 2015; He et al., 2019; He et al., 2023)。这些模型识别影响农田分布的关键因素,量化农田适宜性,并根据适宜性系数进行空间分配。然而,现有方法大多假设各因素与适宜性之间存在线性关系,并依赖统一或专家定义的权重来平衡不同变量的影响。这种简化方法无法捕捉农田发展模式中的区域异质性和复杂非线性机制,从而限制了结果的准确性和可解释性。
在本研究中,引入了非线性适宜性函数来明确描述农田概率对各种因素的连续响应,并结合机器学习得到的变量权重来量化各变量的相对重要性。这一框架提供了一种基于数据且空间适应性强的替代传统方法的方式,显著提高了农田重建的精度和可解释性。此外,该方法具有可移植性,适用于其他地区和土地覆盖类型。
基于改进的重建框架,本文提出了一个新的网格化数据集,重建了1700年至2020年中国东北地区的历史农田分布。该数据集使用基于适宜性的空间分配模型,结合了贾等人(2024)提供的县级农田比例数据,具有30米的空间分辨率,提供了320年期间的28张农田分布图,这是该地区首个高精度、空间明确的长期农田数据集。这项工作填补了数据可用性的关键空白,为进一步研究东北地区的土地利用变化、碳排放和区域生态动态提供了重要基础。