利用机器学习和结构方程模型解析河北省西北部黄土流域中沉积物连通性的驱动因素

《CATENA》:Deciphering sediment connectivity drivers in the loess watershed of northwestern Hebei Province using machine learning and structural equation modeling

【字体: 时间:2026年01月14日 来源:CATENA 5.7

编辑推荐:

  沉积连通性驱动机制研究——以河北黄土高原流域为例

  
王一博|李振|李彦仓|吴珂|齐志国|李哲
河北地质大学土地科学与空间规划学院,石家庄052161,中国

摘要

沉积物连通性是表征流域内侵蚀和沉积物传输的关键指标,受到多种因素复杂相互作用的影响。然而,现有研究尚未充分探讨这些驱动因素的级联效应。本研究以中国西北部黄土区的一个典型流域为例,通过结合高精度数字高程模型(DEM)与高分辨率GF-7和Sentinel-2卫星图像,系统地提取了13个潜在的驱动因素,如地形、植被和沟壑形态特征。研究开发了一种独特的综合分析框架,融合了机器学习和结构方程建模方法。首先使用随机森林(RF)和极端梯度提升(XGBoost)模型评估因素相关性,然后通过Shapley Additive exPlanations(SHAP)方法选择最优特征子集。随后构建了偏最小二乘结构方程模型(PLS-SEM)来定量评估影响沉积物连通性的驱动因素。结果表明,植被因素(NDVILAI)、地形因素(LSKp)和沟壑特征(AL)是RF和XGBoost结合SHAP方法识别出的主要变量。地形因素对沉积物连通性的影响最大(路径值0.66),而植被因素则显著降低连通性(路径系数为?0.45)。沟壑侵蚀对沉积物连通性有正面影响(系数为0.17),其影响受到植被(路径系数=?0.10)和地形(路径系数=0.54)的共同控制。这主要反映了地形的主导作用,超过了植被的抑制效果。此外,在拟合优度方面,包含最优组分的PLS-SEM模型比传统SEM模型性能提高了19.3%。本研究提出了一个新颖的多模型集成框架,为驱动因素选择、效应分析和级联路径评估提供了创新见解,为研究黄土流域的土壤和水资源保护策略提供了坚实的分析方法。

引言

沉积物连通性是衡量沉积物从源头区域传输到汇流区域效率和能力的关键指标。由于它对于理解侵蚀过程中的沉积物生成及其在流域内的空间级联模式具有重要意义,因此受到了研究土壤侵蚀和地貌发育的学者的广泛关注。(Borselli等人,2008;Cavalli等人,2013;Heckmann等人,2018;Shi等人,2025)。系统地描述沉积物连通性特征并阐明其形成过程和驱动机制对于改进土壤和水资源保护规划至关重要。这为土地和空间管理、生态安全保护以及区域土壤侵蚀控制提供了科学基础和技术支持。
连通性指数IC)通过结合汇流路径和地形因素来评估沉积物连通性。其通用性和易用性使其得到了广泛应用(Heckmann等人,2018;Najafi等人,2021)。早期版本主要关注地形特征和流动通道,强调地貌过程的几何控制(Borselli等人,2008)。后续研究逐步引入了表面粗糙度和Manning粗糙度系数等动态权重参数,显著提高了模型适应复杂地形和多种土地覆盖条件的能力(Cavalli等人,2013;Llena等人,2019;Martini等人,2020;Martini等人,2022)。近年来,通过引入降雨、土壤可蚀性、土地覆盖管理和土壤保护措施等多因素加权系统,先进的IC模型在表示物理过程方面的能力得到了进一步提升(Liu等人,2022;Zhang等人,2023b;Wang等人,2024b)。然而,由于土地利用分类的简单性和DEM分辨率的限制,传统的IC模型在山区或过渡性地貌区域的应用仍存在不足,特别是在需要同时考虑复杂表面过程和人为干扰的情况下(Cantreul等人,2018;Zhang等人,2023b)。此外,在中国典型的黄土高原、红土丘陵和黑土地区,沉积物连通性研究取得了显著进展(Liu等人,2022;Wang等人,2024b;Sheng等人,2025)。然而,作为京津冀地区生态屏障的河北西北部黄土区仍缺乏系统的连通性研究,该地区易受风蚀和水蚀影响,生态脆弱性高,地形破碎,土壤侵蚀强度大,这些因素显著影响了区域生态安全和下游水系的沉积过程。因此,迫切需要基于高分辨率数据和综合分析框架的全面研究来阐明该地区的沉积物传输机制和生态响应特征。
目前大多数研究采用线性模型来评估变量之间的相关性,以确定沉积物连通性的驱动因素和过程。研究发现,沟壑形态、降水量、植被覆盖和土地利用/土地覆盖变化(LUCC)都对沉积物连通性有显著影响。尽管植被覆盖和沟壑宽度被认为是限制区域变化的重要因素,但土地利用变化和人类干预(如拦沙坝)往往会降低沉积物连通性(Liu等人,2022;Zhang等人,2023b)。尽管在识别潜在驱动因素方面取得了进展,但这些研究主要关注IC与单个参数之间的线性响应关系,难以捕捉复杂的非线性耦合效应和多元素相互作用。为克服这一限制,非线性算法在沉积物连通性分析中的应用日益增多。随机森林(RF)和Geodetector(GDM)等模型表明,在不同条件下,道路坡度、植被覆盖、坡度坡向和表面粗糙度等因素对IC有显著影响(Jing等人,2022;Liao和He,2023)。此外,偏最小二乘回归(PLSR)分析确定沟壑特征和植被覆盖是沉积物连通性的主要驱动因素,其中植被覆盖和沟壑宽度是关键控制因素(Wang等人,2022a)。情景模拟表明,极端降雨事件会显著增强流域内的沉积物连通性,突显了气候极端条件下的连通性响应特征(Hao等人,2022)。然而,现有研究受到基于经验选择驱动因素、变量解释框架不完善以及分析仅限于成对关系的限制,无法揭示多个变量之间的复杂因果关系和机制。最近,结合可解释的机器学习和结构方程建模(SEM)的多模型集成框架的发展使得对复杂地貌过程的描述更加全面。通过使用RF或梯度提升树(XGBoost)结合Shapley Additive exPlanations(SHAP)方法,可以量化每个驱动因素对模型输出的边际贡献。这种方法解决了传统“黑箱”模型的可解释性局限(Lundberg和Lee,2017;Guidotti等人,2018;Baptista等人,2022;Li,2022;Zhang等人,2023a;Wang等人,2024a;Huang等人,2025)。同时,偏最小二乘结构方程建模(PLS-SEM)能够有效捕捉变量之间的直接和间接相互作用,在生态和水文过程分析中得到广泛应用(Hair等人,2011;Sarstedt等人,2023;Huang等人,2019;Cheng等人,2023;Wang等人,2023;Pan等人,2024)。目前,很少有研究使用PLS-SEM来探究沉积物连通性的驱动路径。以往的研究要么构建了关注沟壑头部土壤特征的PLS-SEM模型,以探讨地上和地下植被特征对这些性质的影响(Zhu等人,2023),要么在模型中将植被或地形作为独立变量(Liu和Fu,2016;Tian等人,2022;Duan等人,2024;Zhu等人,2024)。总体而言,对沉积物连通性驱动路径的深入研究仍然有限。这一差距在生态敏感的河北西北部黄土区尤为明显,该地区是京津冀地区的生态安全屏障。因此,迫切需要一个系统性的研究框架,整合非线性识别和因果分析能力,以推进对区域沉积物连通性演化机制的科学理解。
基于上述研究背景,本研究通过结合高精度DEM与高分辨率GF-7和Sentinel-2卫星图像,确定了三个潜在的驱动因素:地形、植被和沟壑形态特征。开发了一个综合分析框架,融合了RF、XGBoost、SHAP和PLS-SEM,以阐明这些驱动因素的复杂非线性关系和级联效应。本研究旨在为河北西北部生态脆弱地区的土壤和水资源保护及生态屏障建设提供科学支持,同时也为侵蚀控制和可持续区域发展提供理论和方法指导。

研究区域

研究区域位于河北省西北部的阳原县(114°24′E,40°13′N)(图1),处于桑干河流域冲积带的北部边缘,具有典型的山地盆地地貌特征。该地区的地理环境从西北向东南倾斜,地表起伏明显,平均海拔约为1206米。尽管肥力较低,但主要土壤类型为类似黄土的浅栗棕色土壤。

小流域内的沉积物连通性特征

整个小流域内存在显著的空间差异,高连通性单元主要分布在流域的北部和中部,而低连通性单元则主要分布在边缘地区(图2a)。全局Moran's I指数结果显示沉积物连通性存在显著的正空间自相关,Moran's I = 0.302,Z = 9.292,P < 0.001。这表明具有相似连通性的单元在空间上具有明显的聚集性。

影响沉积物连通性的因素差异

植被在减少地表径流和增强土壤抗性方面起着关键作用,从而限制了沉积物从源头到汇流区域的传输(Estrany等人,2019;Wang等人,2022a;Wang和Zhang,2022)。模型贡献分析证实,植被始终抑制沉积物传输,这从LAINDVI在各个模型中的稳定重要性和相似的Shapley值分布得到验证(Asadi等人,2023)。然而,不同因素的响应阈值存在差异。

结论

本研究以河北西北部黄土区的一个典型小流域为例,利用多源遥感和DEM数据开发了一个综合分析框架,包括RF、XGBoost、SHAP解释模型和PLS-SEM。该方法实现了高精度的沉积物连通性筛选和级联路径的定量分析。结果表明,地形特征(LSKp)是空间连通性的主要决定因素。

CRediT作者贡献声明

王一博:撰写——原始草稿、软件开发、方法论、正式分析、数据整理。李振:撰写——审稿与编辑、方法论、概念构建。李彦仓:概念构建。吴珂:软件开发、数据整理。齐志国:方法论、正式分析。李哲:验证、数据整理。

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本研究得到了国家自然科学基金(41601274)和河北省自然科学基金(D2020403067、D2021403006)、河北省中央科技发展引导基金(编号236Z4201G)以及河北地质大学学生研究项目(KAG202505)的财政支持。我们感谢匿名审稿人和编辑提供的有益建议和评论。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号