大型淡水湖流域生态系统中的多尺度协调动态:机器学习揭示了风险-质量-服务过程相互作用的时空变化及其驱动机制
《Ecological Indicators》:Multiscale coordination dynamics in large freshwater lake basin ecosystems: machine learning reveals spatiotemporal variations and driving mechanisms of risk–quality–service process interactions
【字体:
大
中
小
】
时间:2025年11月06日
来源:Ecological Indicators 7.4
编辑推荐:
生态协调机制与可持续发展路径:以洞庭湖盆为例的耦合系统研究
在人类活动与生态退化双重压力下,大型淡水湖盆区的生态系统协调发展的机制仍不明确。为解决这一问题,本研究通过整合生态风险(ER)、环境质量(EQ)和生态系统服务(ES)的子系统,构建了一个综合的生态系统协调发展水平(ECDL)复合指数,并采用耦合协调度模型(CCDM)进行分析。结合探索性时空数据分析(ESTDA)、多尺度地理和时间加权回归(MGTWR)、皮尔逊相关分析以及机器学习算法,研究探讨了ECDL及其多维环境驱动因素的时空变化。在2000年、2010年和2020年间,对洞庭湖盆区、子盆区和网格尺度进行多尺度分析,揭示了ER在湖泊密集区日益集中,而EQ和ES在内陆森林区域持续增长。ECDL在上游子盆区保持稳定,而下游城市集群表现出更低且更碎片化的协调性。郊区农业带和湖岸平原的冷点持续抑制ECDL。ER对ECDL施加了负向约束,子盆区MGTWR系数低至-0.26。EQ在高ECDL聚集区增强,子盆区系数达到0.34。ES表现出强烈的局部敏感性。皮尔逊相关分析显示,自然环境(NE)与ECDL之间存在普遍的正向关联(r > 0.60),但与人为环境(AE)和复合环境(CE)呈负相关。XGBoost–SHAP分析揭示了非线性交互作用,其中NE促进ECDL,AE抑制,CE限制。个体因素的响应机制在子盆区间存在显著差异。NE在西部生态屏障区占主导地位,受CE调节。叶面积指数和土地多样性在归一化值为0.30和0.50时表现出阈值效应。在南方城市-农业过渡区,AE逐渐抑制NE的调节作用。在东部水资源密集区,AE的抑制效应减弱,而NE的调节功能得到恢复。本研究通过强调ECDL的尺度依赖性和环境阈值效应,克服了单一尺度或模型的局限性,为实现可持续发展目标(SDGs 6、11和15)提供了见解。
为了更好地理解生态系统条件和承载能力,需要从多维度视角出发,揭示子系统间的相互作用。生态风险(ER)、生态质量(EQ)和生态系统服务(ES)被广泛认为是评估系统稳定性的关键维度。ER代表外部压力的强度,塑造系统暴露和脆弱性;EQ反映结构和功能的健康状况,为稳定运行提供基础;ES衡量系统满足人类需求的能力,是协调人与环境关系的纽带。这三个维度并非独立,而是通过复杂的机制相互交织。ER扰动的模式影响EQ的稳定性,EQ的变化进一步影响ES的供给,ES的退化可能加剧风险暴露,形成动态的“压力-状态-响应”(PSR)反馈循环。人类活动和土地利用扩展作为主要“压力”,而自然环境如植被和水文条件则代表“状态”。同时,生态政策调节和服务功能体现了“响应”。PSR机制强调了子系统相互作用的循环反馈。这一循环在湖盆区表现出显著的非线性和时空异质性,其中过程高度交织。
鉴于ER、EQ和ES之间的复杂相互作用,本研究将“生态系统协调发展”定义为在多目标约束下实现ER控制、EQ维持和ES提供的动态平衡。在生态阈值和社会需求约束范围内,这一框架旨在最小化ER,稳定EQ,并确保在生态承载能力限制下可持续的ES提供。这一视角强调多个维度的协调发展,避免了诸如以服务换取质量或以使用换取风险增加等片面方法。与单一指标如生物多样性和碳封存相比,ER–EQ–ES框架不仅涵盖了这些维度,还避免了冗余和重叠,从而提供了更大的系统性。ER–EQ–ES框架尤其适用于湖盆区,因为它捕捉了协调发展的生态意义,涉及安全、稳定和实用性,为识别湖盆区生态系统的多尺度协调动态提供了坚实的理论基础。
为了量化ECDL,本研究采用了广泛应用于跨学科领域的CCDM,将ER–EQ–ES子系统整合为一个综合指标。CCDM提供了一个评估多子系统协调发展的定量框架,相比传统的基于相关性的方法,更能反映生态系统结构的相互依赖性和一致性。现有的研究提供了对ER、EQ和ES的广泛定量评估。ER通常被视为压力维度,通过景观破碎度、污染指数和人类活动强度进行测量。EQ常以遥感生态指数(RSEI)、生态功能分区或完整性指标来表征。ES通常通过供需平衡分析或InVEST建模进行评估。然而,大多数研究局限于单一或二维的静态分析,缺乏一个整合ER–EQ–ES过程的框架,并忽略了过程相互作用。这一局限性在湖盆区尤为明显,因为自然条件、土地利用和人类活动放大了生态系统的异质性。最近的研究已开始探讨生态网络在更广泛空间范围内的尺度效应,为盆区尺度系统建模提供了见解。因此,建立一个连接ER–EQ–ES过程的综合模型链是迫切需要的,以更有效地捕捉大型湖盆生态系统动态运行特征。
多个子系统共同驱动ECDL的演变,并在大型湖盆中表现出显著的阶段性异质性转变。研究人员经常使用基于GIS的技术,如标准差椭圆(SDE)、热点分析和重心迁移来研究生态系统演变。例如,Xiong和Yang(2024)发现ER沿陆-水界面扩展,而生态项目和补偿政策增加了森林区ES的供给。然而,这些研究主要针对单一过程,限制了其在ECDL子系统相互作用上的捕捉能力。为了弥补这一不足,一些研究已应用双变量空间自相关、普通最小二乘法(OLS)和地理加权回归(GWR)等模型,以分析生态过程的时空聚类。最近,结合时空敏感性和强拟合的地理和时间加权回归(GTWR)模型在生态协调研究中被广泛应用。例如,Wang等人(2025a)使用GTWR模型评估生态系统服务对可持续发展目标的时空影响。然而,这种方法仅能测量组件之间的相互作用强度,无法有效捕捉ECDL在空间尺度上的局部异质性。因此,精细化多尺度时空非平稳性相互作用的量化对于大型湖盆生态系统的研究至关重要。
在明确了ER、EQ、ES与ECDL的时空相互作用后,下一步是探讨外部环境因素如何驱动ECDL,并为可持续发展战略提供依据。传统方法,如回归分析和地理探测器,往往难以识别非线性相互作用、局部异质性和共线性,限制了其在复杂系统中捕捉驱动机制的能力。在大型湖盆中,不同维度的变量对ECDL显示出显著的非线性影响,一些生态因素表现出阈值响应。随着研究尺度和变量的扩展,传统模型逐渐变得不适用。近年来,随机森林和XGBoost等机器学习方法在生态研究中被广泛采用,因其稳健性和处理高维数据的能力。这些方法在识别非线性相互作用、检测阈值和减少共线性方面表现出色。结合多源数据进一步支持了复杂关系的分析。然而,大多数研究仍关注单一环境维度,忽视了湖盆的尺度敏感性。因此,需要可解释的机器学习方法来揭示自然-人工环境(NAE)因素对ECDL的非线性驱动机制,并克服传统“黑箱”模型的解释限制。
尽管现有研究从不同角度探讨了ECDL,但仍然存在几个重要缺口。首先,在空间尺度上,大多数研究聚焦于单一尺度,忽视了大型湖盆中“水-陆-人”耦合的多尺度异质性,限制了对结构复杂性的捕捉。其次,在指标测量上,当前的ECDL框架缺乏一个整合ER–EQ–ES相互作用的模型链,阻碍了对生态过程真实路径的识别。第三,在时空变化上,现有研究主要关注生态系统演替,对ER–EQ–ES子系统与ECDL之间的动态相互作用及多尺度时空异质性反馈效应关注不足。第四,在机制分析上,研究NAE主导变量与ECDL之间的非线性相互作用仍然有限,限制了对复杂地理系统中更高阶驱动机制的识别。因此,建立一个结合生态过程建模、时空差异和非线性驱动机制的综合框架,以扩展大型湖生态系统耦合协调的理论边界,是至关重要的。
为解决这些缺口,本研究整合了多尺度空间分层与可解释机器学习,分析了大型淡水湖盆区生态系统的协调发展机制。主要贡献包括:(1)在研究尺度上,研究聚焦于中国第二大淡水湖——洞庭湖盆区,通过构建“湖区-子盆区-网格”三级嵌套结构,克服了单一尺度方法的局限性。(2)在研究目标上,耦合协调度模型(CCDM)将ER–EQ–ES子系统整合为ECDL的综合指标,允许对生态系统协调进行全面量化。ER、EQ和ES被选为核心维度,因为它们代表了流域可持续性的关键过程,并涵盖了生物多样性、碳储存和生态完整性等属性。(3)在时空变化上,整合了探索性时空数据分析、双变量空间自相关和多尺度地理与时间加权回归(MGTWR)模型,以建立连接ER–EQ–ES子系统与ECDL的框架。与GTWR相比,MGTWR提供了多尺度参数估计,使得灵活调整尺度和精确识别局部响应强度成为可能。(4)在机制识别上,高分辨率遥感数据结合XGBoost–SHAP模型揭示了多维NAE因素对ECDL的非线性驱动路径。它为揭示大型湖盆中的复杂驱动机制提供了方法论支持。
为实现研究贡献,本研究设定了四个目标:(1)使用Google Earth Engine(GEE)、Fragstats、InVEST模型、ENVI和ArcGIS识别洞庭湖盆区2000年、2010年和2020年的ER、EQ和ES指标及NAE驱动因素;(2)应用SDE、重心迁移模型和热点分析来检验ECDL的时空聚类和差异;(3)使用双变量空间自相关和MGTWR模型分析ER–EQ–ES子系统与ECDL之间的时空依赖性和多尺度非平稳性;(4)使用皮尔逊相关分析初步识别NAE变量对ECDL的线性相互作用,并应用XGBoost–SHAP算法揭示多尺度下的非线性压力机制。
研究区域选择洞庭湖盆区,该区域是中国第二大淡水湖系统,包括湖本身及其四大主要支流:湘江、资水、沅江和澧水。基于水文系统,该盆区被划分为八个子盆区:澧水流域、南北沅江流域、南北资水流域、南北湘江流域以及洞庭湖环区。该盆区形成了高度耦合的水-陆-人系统,具有密集的湖泊网络、多样的生态系统和复杂的生态调节。近年来,人类活动对生态敏感区的扩张已破坏了子盆区和盆区层面的生态系统协调。为应对这些挑战,开发了一个多尺度框架,包括盆区、子盆区和网格层面,以识别洞庭湖盆区的ER–EQ–ES相互作用和NAE驱动路径。
数据分为ECDL和NAE两类。ECDL包括三个维度:ER、EQ和ES。ER通过基于30米土地利用/土地覆盖变化(LUCC)数据的景观指数进行量化。EQ通过MODIS产品(MOD13A1、MOD11A2、MOD09A1)中的NDVI、LST、WET和NDBSI进行测量,代表绿色度、湿润度、干旱度和热力。与单一指标相比,RSEI提供了对生态环境的更全面衡量,且无需人工干预,结果更具客观性。这四个指标的计算方法在补充方法SIII-1中进行了描述。RSEI通过主成分分析(PCA)提取第一主成分(PC1)进行计算。PCA通过正交变换压缩多维信息,从而减少冗余并提高指标代表性。RSEI的计算公式如下:
$ RSEI = 1 - \frac{PC1 - \min(PC1)}{\max(PC1) - \min(PC1)} $
其中,$ RSEI $ 代表综合生态质量指数;$ PC1 $ 是第一主成分;$ \min(PC1) $ 和 $ \max(PC1) $ 分别是主成分的最小值和最大值。参考ER分类方法,EQ被分为5个等级:I(0–0.3]、II(0.3–0.45]、III(0.45–0.55]、IV(0.55–0.7]和V(0.7–1]。为了测试指标构建的稳健性,进行了敏感性分析。首先,调整了权重a、b和c的±10%,结果显示出总体相关系数大于0.95,表明等权重假设是合理的。其次,比较了Min–Max和Z-score标准化方法,不同方法下的全局ECDL值差异小于5%。这些结果表明,ECDL对权重和标准化选择不敏感,确保了所采用方法的稳健性。
为了探索ECDL的时空演变模式,本研究应用了探索性时空数据分析。通过ArcGIS工具提取了洞庭湖盆区ECDL的中心位置,并分别计算了其椭圆的长轴、短轴和方向角。计算公式如下:
$ \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} $, $ \bar{y} = \frac{\sum_{i=1}^{n} y_i}{n} $
$ S_x = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n}} $, $ S_y = \sqrt{\frac{\sum_{i=1}^{n} (y_i - \bar{y})^2}{n}} $
$ \tan(2\theta) = \frac{2\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^{n} (x_i - \bar{x})^2 - \sum_{i=1}^{n} (y_i - \bar{y})^2} $
其中,$ x_i $ 和 $ y_i $ 分别是第i个单元的坐标;$ \bar{x} $ 和 $ \bar{y} $ 是重心坐标;$ S_x $ 和 $ S_y $ 分别是沿x轴和y轴的标准差,代表椭圆的半轴长度;$ \theta $ 是旋转角;$ n $ 是总单元数。通过热点分析进一步探讨了研究区域中ECDL的空间聚类特征。使用Getis-Ord Gi*统计量量化相邻单元属性值的空间聚集程度。计算公式如下:
$ S = \sqrt{\frac{\sum_{j=1}^{n} X_j^2}{n} - (\bar{x})^2} $
$ G_i^* = \frac{\sum_{j=1}^{n} W_{ij}X_j - \bar{x} \sum_{j=1}^{n} W_{ij}}{S \sqrt{\frac{n \sum_{j=1}^{n} W_{ij}^2 - (\sum_{j=1}^{n} W_{ij})^2}{n - 1}} $
其中,$ W_{ij} $ 是单元i和单元j之间的空间权重;$ X_j $ 是单元j的属性值;$ n $ 是总单元数。通过这种方式,本研究能够更全面地捕捉ECDL的时空演变模式。
研究结果表明,ER、EQ和ES子系统在洞庭湖盆区的时空演变模式存在显著差异。ER在湖泊密集区表现出显著增加,而EQ和ES在内陆森林区域持续增长。ECDL在上游子盆区保持稳定,而在下游城市集群中表现出较低且更碎片化的协调性。郊区农业带和湖岸平原的冷点持续抑制ECDL。ER对ECDL施加了负向约束,子盆区MGTWR系数低至-0.26。EQ在高ECDL聚集区增强,子盆区系数达到0.34。ES表现出强烈的局部敏感性。皮尔逊相关分析显示,自然环境(NE)与ECDL之间存在普遍的正向关联(r > 0.60),但与人为环境(AE)和复合环境(CE)呈负相关。XGBoost–SHAP分析揭示了非线性相互作用,其中NE促进,AE抑制,CE约束。个体因素的响应机制在子盆区间存在显著差异。NE在西部生态屏障区占主导地位,受CE调节。叶面积指数和土地多样性在归一化值为0.30和0.50时表现出阈值效应。在南方城市-农业过渡区,AE逐渐抑制NE的调节作用。在东部水资源密集区,AE的抑制效应减弱,而NE的调节功能得到恢复。本研究通过强调ECDL的尺度依赖性和环境阈值效应,克服了单一尺度或模型的局限性,为实现可持续发展目标(SDGs 6、11和15)提供了见解。
研究进一步探讨了主导NAE因素对ECDL的交互驱动机制。通过XGBoost算法识别了NAE对ECDL的主导机制。XGBoost基于梯度提升决策树,能够建模复杂的非线性关系并处理高维特征。与传统树模型相比,XGBoost在处理缺失值和大规模数据集时更具鲁棒性,并减轻了共线性问题。在训练过程中,XGBoost采用贪心策略选择最优分割节点,逐步构建树以拟合残差,并通过迭代提升增强整体预测性能。其目标函数由经验损失和正则化项组成,确保了拟合精度和泛化能力。为了提高效率,模型对损失函数进行了二阶泰勒展开,并通过梯度和海森矩阵更新参数,平衡了速度和精度。建模使用了Python 3.12.10中的“XGBoost”包。目标函数定义如下:
$ O(\phi) = \sum_{i} l(\hat{y}_i, y_i) + \sum_{n} \Omega(f_n) $
其中,$ l(\hat{y}_i, y_i) $ 表示损失函数;$ \Omega(f_n) $ 表示正则化项;$ \gamma $ 表示模型复杂度;$ T $ 是叶节点数量;$ \omega $ 是叶节点的权重向量。通过这种方式,本研究能够更全面地捕捉NAE因素对ECDL的非线性交互作用。
本研究还采用SHAP算法探索了NAE变量对ECDL的非线性交互效应。SHAP源自合作博弈论中的夏普利值概念,量化了每个变量及其交互作用对模型输出的边际贡献,从而提升了“黑箱”模型如XGBoost的可解释性。其主要优势在于能够提供全局和局部解释,阐明不同驱动因素在塑造ECDL中的作用。在复杂的非线性模型中,SHAP揭示了每个特征的边际贡献,克服了传统解释方法的局限性。所有计算均在Python 3.12.10中使用“SHAP”包进行。特征i的SHAP值定义如下:
$ \phi_i = \sum_{S \subseteq N \backslash \{i\}} \frac{|S|! (M - |S| - 1)!}{M!} (f(S \cup \{i\}) - f(S)) $
其中,$ \phi_i $ 表示特征i的贡献;N是所有特征的集合;$ f(S \cup \{i\}) $ 和 $ f(S) $ 分别表示包含和不包含特征i时的模型输出。
研究结果表明,ECDL的演变反映了多种因素的综合作用,特别是自然环境因素(NE)的促进作用、人为环境因素(AE)的抑制作用以及复合环境因素(CE)的结构约束。NE因素如叶面积指数(LAI)、归一化差值水指数(NDWI)和地形指数(TWI)持续主导,形成了生态系统协调发展的生态基础。相比之下,AE因素如建设密度(CLD)和人口密度(PD)表现出越来越强的阶段性和结构约束。CE因素如土地利用多样性指数(SHDI)和土地利用集聚指数(CONT)也显示出显著的非线性相互作用。通过这种方式,本研究揭示了ECDL的复杂驱动机制,并为实现多尺度协调提供了理论支持。
研究还指出,洞庭湖盆区的协调发展机制在不同尺度上存在显著差异,强调了尺度效应在盆区治理中的重要性。在盆区尺度上,进化趋势受到宏观政策和经济周期的影响。相比之下,子盆区和局部单元尺度的协调更敏感于土地利用扰动。下游城市集群表现出较低的协调性,部分原因是政策实施周期与生态系统恢复周期不匹配。例如,2018年洞庭湖水环境综合治理计划、2022年控制和减少总磷污染行动方案以及2023年新时期的洞庭湖生态经济区规划计划表明政策强化的时间趋势。然而,生态改善往往滞后,短期协调性并未显著提高。因此,治理策略应协调政策节奏与生态响应,加强跨尺度合作以提高整体协调性。
为了促进大型湖盆区生态系统的协调发展,本研究提出了基于驱动因素分析的多尺度可持续路径,强调分区治理、多维协作和动态响应。在盆区尺度上,应优先考虑风险控制、生态修复和服务增强,通过跨区域协调应对湖扩散效应。在子盆区尺度上,上游生态屏障区(B1–B3)应优化生态结构,减少森林破碎度,提高植被连通性。鉴于NE调节作用的减弱,政策情景应侧重于降低破碎度和增强连通性,支持森林修复投资和协调效益的定量评估,符合SDG 15(陆地生命)和SDG 13(气候行动)。在中游农业-城市-生态过渡区(B4–B6),需限制开发强度,防止高强度建设向周边森林扩散。政策情景应针对建设密度和人口聚集,其中AE干扰在该区域占主导地位。治理成效可通过成本-效益分析进行评估,其中成本包括建设控制和土地修复,效益则通过ECDL改善来衡量,符合SDG 11(可持续城市和社区)和SDG 15。在下游水网密集区(B7–B8),恢复河岸带和建设缓冲区是缓解水资源开发压力的关键。政策情景应优先考虑水资源保护和经济转型,促进节水农业、高效灌溉和划定农业与生态红线。这些措施在农业扩张与生态保护之间取得平衡,支持SDG 6(清洁水与卫生)。在局部尺度上,建议进行生态阈值管理和网格化调节,并建立生态数据库和动态监测系统,以同步干预与生态变化。
综上所述,本研究开发了一个结合多尺度嵌套、生态过程相互作用和机器学习的框架,推进了ER、EQ和ES子系统协调发展机制的理解。未来盆区治理应平衡自然保护与人类活动控制,促进生态资源和开发强度的梯度管理。研究结果为实现SDG 6、SDG 11和SDG 15提供了决策支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号