《Ecological Informatics》:A data-driven framework for evaluating categorical versus gradient representations of land-use intensity
编辑推荐:
摘要
土地利用强度的分类是生态研究与土壤健康监测的核心,但常用的先验(a priori)类别(如“常规”、“粗放”、“半自然”)可能过度简化管理实践的多样性。此类简化会掩盖管理强度的连续变化,而后者能更真实地反映潜在生态过程。在此,研究人员提出了一种数据驱动的
摘要
土地利用强度的分类是生态研究与土壤健康监测的核心,但常用的先验(a priori)类别(如“常规”、“粗放”、“半自然”)可能过度简化管理实践的多样性。此类简化会掩盖管理强度的连续变化,而后者能更真实地反映潜在生态过程。在此,研究人员提出了一种数据驱动的分析流程,用于在将管理数据与生态响应关联之前,仅基于管理数据评估土地利用强度的替代表征方案。该框架结合无监督聚类、基于梯度的排序(gradient-based ordination)以及定量诊断指标,以评估特定系统中的管理强度更适合表示为离散类别、涌现聚类(emergent clusters)或梯度。利用来自18块荷兰草地的管理调查数据,研究人员比较了先验土地用途类别、后验(post priori)聚类以及由多变量管理变量导出的梯度。聚类分析显示不同类别标签的田块间分离较弱,而梯度捕获了更平滑的管理变化模式,并与独立的遥感代理指标吻合更紧密。模型比较进一步表明,基于梯度的表征比分类替代方案略好地反映了管理强度。结果表明,对分类结构进行数据驱动评估可指导土地利用强度表征方式的选择,降低将任意类别强加于连续管理变化的风险。所提出的流程广泛适用于需要将异质管理及监测数据转化为准确变量的生态情境,包括环境监测与生态系统评估。
一、研究背景与意义
土地利用强化是生态退化的关键驱动因子,对地上及地下生物多样性具有显著且被广泛记录的影响。集约化农业土地利用改变土壤物理、化学及生物性状,常削弱养分循环、水分保持、碳固存及生物栖息地功能,引发对集约农业可持续性的广泛关注,也推动了土壤健康监测的发展,例如欧盟《土壤监测法》(EU Soil Monitoring Law)。
一个核心挑战是如何对管理强度进行分类,并将其与生态系统过程关联。历史上常采用先验分类(如“常规”“有机”“粗放”),这类标签简单易懂,但可能掩盖类别内部的变异,降低比较土地利用与管理强度效应的判别力。尤其在有机与常规之间,认证体系(如荷兰SKAL Biocontrole)仅规范有机生产,而“常规”“再生”等缺乏统一认证;且强度维度可同时跨越有机与常规体系。因此,即便有认证,先验类别也可能模糊真实管理差异及其生态效应。例如某些有机认证田块仍可能高强度利用,影响土壤多功能性。此外,“常规”一词渐具意识形态色彩,掩盖其内部实践多样性。这凸显了在评估土地利用影响时,需批判审视先验分类并考虑数据驱动的替代方案。
为克服先验分类局限,梯度或管理指数日益被提倡,通过整合施肥量、刈割频次、放牧压力、牲畜密度等多变量更细腻地刻画强度。已有研究提出复合土地利用强度指数(LUI)、基于PCA的梯度等,均显示连续指标在解释草地土壤多功能性等方面优于二元/三元标签。然而,何时连续指数优于类别标签仍缺乏系统判断框架,现有选择常依赖事后(post-hoc)评估,易引入偏差。理想决策应在生态数据采集前,仅基于管理数据完成。目前尚缺清晰的数据驱动依据,来判断管理更适合表示为离散类别、后验聚类或梯度。
本研究发表于《Ecological Informatics》,提出一个通用数据驱动分析框架,在关联生态响应前,先基于管理数据评估强度结构是离散还是连续。以荷兰18块草地为案例,比较先验类别、后验聚类及梯度表征,并用遥感代理指标(S2REP)独立验证,回答:仅从管理数据出发,何种分类方案更合适?
二、主要关键技术方法概览
研究人员在荷兰Ooijpolder选取18块长期(≥10年)稳定管理的草地,分为先验三类:常规(perennial ryegrass单作+化学投入)、粗放(草本丰富+仅有机肥)、半自然(低产草本丰富+无外源粪肥),每类6块。通过农户管理调查获取施肥、刈割、放牧、农药等变量,并在每田块内设置3个2×2 m样方以Braun-Blanquet法调查植物丰富度,形成田块(n=18)嵌套样方(n=54)结构。
以Sentinel-2红边位置(S2REP,B4/B5/B6计算)作为草地管理强度的独立遥感代理,取2022年4月两景低云影像均值提取样方缓冲区中值。因一常规田块云覆盖缺失,分析降至17田块(n=51样方)。
数据驱动框架步骤:
1)管理变量筛选(连续/二值,Spearman R<0.8保留生态关键信息如植物丰富度、化肥/有机肥输入);
2)z-score标准化;
3)后验聚类:欧氏距离+Ward最小方差层次聚类(k=3),以UMAP二维可视化,Adjusted Rand Index(ARI)及轮廓系数(silhouette width)、Gap Statistic评估;
4)梯度提取:PCA第一主轴(PC1)作为一维强度梯度,重缩至[0,1],用coefficient of variation(COV)检验场沿梯度的均匀性;
5)评估:以S2REP为响应变量,拟合线性/广义混合效应模型(Field为随机截距),比较先验类别、后验聚类及梯度固定的效应,用conditional R2、AIC、BIC选优。
三、研究结果
3.1 先验与后验聚类比较
后验聚类与先验类别总体可比但不完全一致(ARI=0.72)。UMAP显示两片先验“粗放”田块在后验中被重新分配至“半自然”簇,导致簇大小失衡(常规6、粗放4、半自然8)。平均轮廓系数仅0.340(<0.5常视为弱分离),Gap Statistic在k=1–10内未出现明显最优,暗示数据缺乏强离散簇而更支持梯度。
3.2 土地利用强化梯度
PCA的PC1特征值4.65,解释方差58.15%;PC2为1.36(17.00%)。田块沿PC1渐变排列。有机肥输入(m3 ha?1)、植物物种丰富度、化学氮肥(kg N ha?1)对PC1贡献最大(|coef|>0.40),草地年龄主要关联PC2。一维梯度从最强集约(常规)到最弱(半自然)连续分布。
3.3 评估
三类方案均显著预测S2REP(p<0.001),conditional R2分别约0.956、0.955、0.955;梯度模型AIC=95.23、BIC=102.96略低于后验聚类(AIC=97.69、BIC=107.35)与先验类别(AIC=97.80、BIC=107.47)。场沿梯度分布的COV=0.86,低于随机均匀基线均值0.92(SD=0.21),远小于极端聚类COV=√17≈4.12,支持梯度解释。
四、讨论与结论总结
4.1 先验vs后验
假设部分成立:后验聚类与先验类别有较高但非完美匹配,某些“粗放”田块因租自林务局、农药禁用且投入更低,实际更接近“半自然”。这说明基于农民认知的简单类别会忽略真实管理变异。后验聚类AIC/BIC稍优但差异小,二者解释力相当。
农业管理受当地环境、经济与农民偏好塑造,同类别内实践可异(如有机/常规内部差异),且对同一方案的解读与执行(如参与农环计划)因人而异,可能影响生物多样性和生态系统过程。因此,基于实际管理的数据驱动评估优于仅依赖预设标签。
4.2 土地利用作为梯度:聚类的替代
结果汇合支持将强度视为连续体。三类模型解释S2REP方差相近,但低轮廓系数(0.34)、无Gap最优、梯度模型稍低AIC/BIC及COV接近随机均匀,共同暗示数据不强烈支持离散边界。部分田块跨类别更似邻类而非同类,符合管理实践连续过渡。
COV分析显示场沿PC1大致均匀,与空间均匀随机分布一致且远低于极端聚类,支持连续分布。但小样本下需多指标联合判断(COV、轮廓、Gap、AIC/BIC)。这与既往研究呼应:有机—常规系统间实践连续重叠,连续强度指标常优于二分法。
研究人员采用PCA梯度(而非仅求和mowing/grazing/fertilization),以纳入时间变量(草地年龄、管理年限),因为土壤滞后(soil hysteresis)等时间效应可影响生态过程。植物丰富度在此被当作管理变量(农民通过除草、混播直接管理群落),对PC1为负向贡献且权重相当。
但梯度仅反映当前管理状态,不捕获历史轨迹(起始强度、转换时长与节奏),而后者可能影响土壤生物群落等。可加入“自转换以来时间”等变量改进。此外,梯度是管理数据的统计模式;生态过程(如有机质分解)是否连续响应或存在阈值,需结合生态响应数据检验。
该框架提供COV、Gap Statistic、轮廓系数、ARI等工具,避免无梯度假定梯度或强行分类。虽案例小且区域局限,但标准化多元方法可扩展至更大规模与其他农业系统,也为CORINE等土地覆盖监测中定义不一致问题提供改进思路。
4.3 结论
正如Blüthgen等人(2012)指出,“量化土地利用强度并非平凡问题”。广义分类(如常规vs有机)可能失效于真实农场系统内的变异,限制我们理解强度对生态系统过程的影响。本研究表明,多指标结合时梯度法略准于分类法(差异小需语境解读);即便使用预设类别,与后验标注的匹配也不完美,暗示类别边界未必反映管理实践底层变异。三种方案均捕获草地管理强度的强显著结构,梯度提供稍更简洁的拟合。
生态学家、土地管理者及监测项目日益面对异质土地利用系统的分类挑战。本文提供了易用的度量工具,仅依赖管理数据与公开遥感数据,便可在关联生态结果前辅助选择更合适的表征,推动更细腻的跨研究比较,减少确认偏误,为链接土地利用强度与生态产出奠定更稳健基础。