利用可解释小波(wavelet)–粒子群优化(PSO)–深度学习框架预测不同湖泊类型的CO2通量

《Journal of Hydrology: Regional Studies》:Predicting CO2 fluxes across diverse lake types using an interpretable wavelet–PSO–deep learning framework

【字体: 时间:2026年06月09日 来源:Journal of Hydrology: Regional Studies 4.7

编辑推荐:

  研究区域:美国Falling Creek Reservoir、中国青海湖(Qinghai Lake)、芬兰Vanajavesi及德国Zarnekow Polder。研究焦点:湖–气CO2通量受气候、营养状态、水文及形态特征的调控,但在差异显著的湖泊系统中实现准

  
研究区域:美国Falling Creek Reservoir、中国青海湖(Qinghai Lake)、芬兰Vanajavesi及德国Zarnekow Polder。研究焦点:湖–气CO2通量受气候、营养状态、水文及形态特征的调控,但在差异显著的湖泊系统中实现准确预测仍具挑战。研究人员探究了四类对比湖泊的CO2动态,构建了可解释的Wavelet–PSO–Deep Learning框架,集成小波分解(wavelet decomposition)、粒子群优化(particle swarm optimization, PSO)、循环神经网络(即门控循环单元gated recurrent unit, GRU和长短期记忆网络long short-term memory, LSTM)以及Shapley加性解释(Shapley Additive exPlanations, SHAP);比较了含滞后通量特征方案与含气候变量方案,并将深度学习模型与机器学习模型进行了评估。新水文见解:四湖泊呈现相反的CO2源–汇格局——青海湖与Zarnekow Polder为净CO2汇,Falling Creek Reservoir与Vanajavesi为持续CO2源,反映湖泊形态、营养状态、水化学条件及区域气候的综合控制作用。该框架利用滞后通量捕捉时间依赖性,GRU与LSTM在仅滞后(Lag-only)方案下验证期Nash–Sutcliffe效率(Nash–Sutcliffe Efficiency, NSE)达0.593–0.895,且在测试集保持可靠性能。SHAP分析表明近期通量历史主导预测,为CO2动态的时间持续性提供了可解释证据。递归预报与空间泛化分析显示该框架可支持短期预报并改善湖泊CO2评估的时间连续性与空间代表性,服务于区域碳收支估算与适应性湖泊管理。
论文解读:利用可解释小波(wavelet)–粒子群优化(PSO)–深度学习框架预测不同湖泊类型的CO2通量
该文发表于《Journal of Hydrology: Regional Studies》。内陆水体虽仅占地球表面积约2.2%,却在全球生物地球化学循环中作用显著,是温室气体(greenhouse gas, GHG)的重要源/汇。现有全球湖泊CO2排放估算差异极大(0.14–0.90 Pg C yr?1),主因在于CO2通量受水温、pH、碱度、风速及生物代谢等多因子耦合影响,具强时空变异性。传统过程模型参数难获取且移植性差;卫星反演多局限于富营养化湖泊;常规机器学习难以刻画时序依赖,"黑箱"特性阻碍机理解释。涡度协方差(eddy covariance, EC)技术可提供高频半小时间歇CO2通量,但噪声大、缺测多。因此,研究人员拟开发融合信号去噪、超参自动寻优及可解释性的深度学习框架,以跨湖泊类型预测日尺度CO2通量并揭示其时间依赖机制。
为达成目标,研究人员从北美、欧洲及亚洲初筛15个EC站点(源自Hounshell et al. 2023、Li et al. 2022及Golub et al. 2023综合数据集),保留≥365 d有效日均值、缺失率<10%、无>30 d连续缺测的4个湖泊:美国Falling Creek Reservoir(富营养化,小型水库)、中国青海湖(寡营养化,大型高原咸水湖)、芬兰Vanajavesi(富营养化,大型湖泊)、德国Zarnekow Polder(富营养化,小型浅水圩田湖)。EC半小时数据聚为日均值,短于7 d缺口线性插值,残余用15 d中心滑动平均填补。气象驱动(气温、蒸发、地表气压、降水、短波辐射、水汽压亏缺(vapor pressure deficit, VPD)、比湿、风速)取自ERA5?Land并重采样匹配。关键技术方法包括:(1)db4小波(wavelet)二级分解+VisuShrink软阈值去噪;(2)构造30 d滞后CO2通量为自回归特征,设Lag?only(仅滞后)与Lag?Climate(滞后+气象)两输入方案;(3)对比随机森林(random forest, RF)、多层感知器(multi?layer perceptron neural network, MLP?NN)、LSTM及GRU四种模型,数据集按7∶1.5∶1.5分训练/验证/测试集,min?max归一化,用粒子群优化(particle swarm optimization, PSO)自动寻优超参数并以验证集NSE为目标函数,各配置重复30次;(4)采用Shapley加性解释(Shapley Additive exPlanations, SHAP)量化特征贡献;(5)开展递归多步预报检验时间鲁棒性及将GRU迁移至太湖MODIS CO2浓度数据检验空间泛化性;(6)用Mann–Whitney U检验进行统计显著性比较。
3.1. Temporal characteristics of CO2flux in four lakes(四个湖泊CO2通量的时间特征)
通过分析EC观测日均CO2通量,青海湖(?0.31 μmol m?2s?1)与Zarnekow Polder(?0.51 μmol m?2s?1)为净CO2汇,Falling Creek Reservoir(1.37 μmol m?2s?1)与Vanajavesi(0.27 μmol m?2s?1)为持续CO2源。各湖具明显月/季变化:Falling Creek夏季排放峰(7月4.28),冬季最低(0.34);青海湖冬春为汇(12月?1.98)夏为源(最高0.93);Vanajavesi全年源,8月峰(0.64);Zarnekow Polder夏/春秋为汇(夏?1.73)、冬为源(0.57)。表明源–汇行为受区域气候、形态、营养状态、水文及内碳循环共同调控,非仅由营养状态决定。
3.2. Data?driven modeling of CO2flux(CO2通量的数据驱动建模)
经PSO优化超参数后,在验证集Lag?only方案下GRU与LSTM的NSE为0.593–0.895,整体优于RF与MLP?NN(MLP?NN最差)。Lag?only普遍优于Lag?Climate,说明滞后通量信息对捕捉时间变异最关键。GRU多数情形下略优于LSTM,RF在Lag?Climate下有时接近LSTM。
3.3. Temporal robustness of CO2flux prediction(CO2通量预测的时间稳健性)
独立测试集上GRU与LSTM经30次重复取均值集合预测仍稳定:青海湖与Zarnekow Polder测试NSE最高(~0.86与~0.84),Vanajavesi中等(~0.72),Falling Creek Reservoir较低(NSE ~0.28–0.33)。Mann–Whitney U检验证实深度学习模型及Lag?only方案显著更优(p<0.05)。
3.4. Interpretability analysis of the model(模型的可解释性分析)
对最优GRU模型(Lag?only方案)做SHAP全局分析,四湖均显示最近一期滞后通量(Lag?1)贡献最大,其次为Lag?2(青海湖、Vanajavesi、Zarnekow Polder)或Lag?4(Falling Creek Reservoir),证明模型真正依赖CO2通量自身短时记忆而非伪相关,且记忆时长/结构具湖泊特异性。
讨论与结论总结
研究人员指出,青海湖整体呈CO2汇与其咸碱水化学环境、碳酸盐平衡及季节性热力分层–混合有关,区别于典型淡水湖认知;Zarnekow Polder夏为汇源于生长季强生物固碳(泥炭湿地植被);Falling Creek Reservoir与Vanajavesi因浅水形态、暖季呼吸/有机质矿化及高效垂向交换呈持续源。营养状态不能单独解释源–汇差异。Wavelet–PSO–Deep Learning框架经小波去噪与PSO自动调参,借助滞后通量捕捉时序依赖,GRU/LSTM在跨类型湖泊具稳健预测力,SHAP赋予"黑箱"可解释性。递归预报(青海湖NSE=0.48,Zarnekow Polder NSE=0.69)与太湖CO2浓度空间泛化(R2≈0.85,月均值R2≈0.98)表明框架具时空外推潜力,可补强稀疏监测网、降低区域碳收支估算不确定度,亦有望拓展至CH4等其他GHG通量。局限含未纳入水体化学参数(pH、碱度)、极端气候事件冲击未专门建模,未来可融注意力机制、扩大EC及水质站网并耦合遥感产品。
结论(翻译):
本研究调查了具对比气候、水文、营养及形态特征的四个湖泊的CO2源–汇动态,并开发了可解释Wavelet–PSO–Deep Learning框架用于高频CO2通量预测。四湖呈差异化区域模式:青海湖与Zarnekow Polder平均为净CO2汇,Falling Creek Reservoir与Vanajavesi为持续CO2源,表明湖泊CO2源–汇受多因子交互调控而非仅营养状态。青海湖代表大型高原咸水寡营养系统,碳酸盐化学、水化学缓冲、季节热力结构与气–水交换强烈影响CO2动态,其整体CO2汇行为不同于"内陆湖一般为大气CO2源"的普遍认识,突显青藏高原咸水湖碳循环特殊性。Falling Creek Reservoir与Vanajavesi代表较浅富营养系统,暖季呼吸、有机质矿化及垂向交换促持续CO2排放。Zarnekow Polder虽浅且富营养但呈不同季节模式,可能因其泥炭关联植被条件促进生长季CO2吸收。所提框架利用滞后通量信息有效捕捉湖泊CO2通量时间依赖并在异质环境中给出稳健预测。SHAP分析确认近期通量历史主导预测,为框架捕获CO2动态有意义时间依赖提供可解释证据。递归预报与空间泛化展示该框架可改善湖泊CO2评估的时间连续性与空间代表性,对降低区域碳收支估算不确定性、支持变化气候下适应性监测及湖泊管理具重要意义,尤针对青藏高原等气候敏感区。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号