
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于神经网络估算苏必利尔湖碳循环的季节至年际变异性
【字体: 大 中 小 】 时间:2025年09月20日 来源:Journal of Geophysical Research: Biogeosciences 3.5
编辑推荐:
本研究利用前馈神经网络(FFNN)重构了苏必利尔湖2019-2023年日平均表层水二氧化碳分压(pCO2)及湖-气CO2通量,空间分辨率达0.02°×0.02°。通过航测pCO2数据训练模型,揭示了湖泊在碳汇(年均-0.30 Tg C yr-1)与碳源(年均0.06 Tg C yr-1)间的动态转换,五年平均净通量为-0.14 Tg C yr-1。该研究显著降低了苏必利尔湖碳预算的不确定性,为机器学习在湖沼生物地球化学循环研究的应用提供了范式。
地球大气二氧化碳(CO2)浓度自工业革命前至今已增长超50%,除加剧温室效应外,更导致CO2向地表水体入侵并引发系列化学与生态效应。尽管海洋碳循环研究已取得长足进展,但内陆水体因观测数据匮乏与变异性显著,其碳循环过程仍存在显著认知空白。作为全球最大淡水湖群,劳伦森五大湖(简称五大湖)的碳收支研究尤为关键。近年观测表明,苏必利尔湖表层水pCO2在过去二十年持续上升,但因观测时空覆盖不足,难以揭示其短时间尺度与空间异质性特征。
苏必利尔湖碳收支的显著矛盾体现为:本顿顿等基于生物地球化学过程模型推断其年均CO2逸散通量为0.19 Tg C yr-1,而兄弟与西布利基于代谢观测数据则推断年均吸收通量为-0.4 Tg C yr-1。这一分歧凸显了传统观测与建模方法在捕捉湖泊碳循环动态复杂性方面的局限。
为突破观测数据碎片化瓶颈,本研究借鉴海洋碳循环研究中的统计重建技术,利用2019-2023年无冰期航测pCO2数据,构建基于前馈神经网络(FFNN)的时空连续重建模型,首次生成五年期全湖尺度CO2通量估算,为厘清苏必利尔湖碳循环的季节与年际变异性提供新范式。
航测pCO2数据来源于2019-2023年无冰期(4-11月)90个湖面走航航次,由搭载双喷头平衡器的SuperCO2仪器以2秒间隔采集,经标准气体校正后聚合为0.02°网格日均值,共计9.3×104个观测点,测量误差为±5 μatm。
神经网络输入参数需满足三大条件:与pCO2具代理关系、全覆盖2019-2023年湖域、无时空缺失。最终选定湖面温度(LST)、向下光合有效辐射(PAR)、10米风速(U10)及基于Sterner公式计算的初级生产力。其中LST与冰覆盖率来自大湖表面环境分析系统(GLSEA),PAR与U10来自北美区域再分析数据,初级生产力由LST与PAR计算得出。大气CO2干摩尔分数(xCO2)取自WLEF高塔观测站。
FFNN模型包含4个输入神经元(对应上述参数)、128与32神经元的两个隐藏层(ReLU激活)及1个线性激活输出神经元。采用80%数据训练、20%测试,以平均绝对误差最小化为目标,配合丢弃率0.2与早停策略防止过拟合。模型预测误差主要来源于观测误差(±5 μatm)、网格聚合误差(±1.9 μatm)及模型自身误差(±27.0 μatm),合并不确定性为±27.5 μatm。
湖-气CO2通量计算采用风速参数化方案:通量 = k·α·(1-ice)·(pCO2water - pCO2atm),其中气体传输速度k=0.266·U102·(Sc/660)-0.5,Sc为施密特数,α为CO2溶解度,ice为冰覆盖率。通量空间积分后按模型网格面积(77,110 km2)占实际湖面面积(82,100 km2)比例93.9%进行校正。
重建pCO2与独立瓶样测量对比显示:作者团队样本平均绝对误差为12.7 μatm,美国环保署大湖国家项目办公室(GLNPO)样本中位绝对误差为27 μatm,与模型不确定性(27.5 μatm)一致。虽部分GLNPO数据存在异常高值(或源于pH与总碱度测量误差),但整体验证了重建结果在无冰期的可靠性。
越冬锚系观测(2022年10月-2023年5月)表明:重建值与10米深处传感器数据在秋季高度吻合(误差12.7 μatm),但春季偏差增大(平均低估53 μatm)。该差异可能源于传感器漂移(约40 μatm/8个月)或生物污染,而非湖层化效应(混合层深度>10米)。
重建湖面pCO2范围283-515 μatm,均值402±46 μatm,CO2通量范围-96至31 mmol C m-2 d-1,均值0.4±4.0 mmol C m-2 d-1。去季节化后未检测到显著年际趋势,可能因年际变异性(尤其春秋季)掩盖了五年间约13 μatm的大气pCO2增长。
年均pCO2周期呈现双正弦特征:两个极小值分别出现在2月中旬(与LST极小值重合)和8月下旬(与初级生产力极大值重合);两个极大值出现在6月初(升温驱动)和12月初(非热力因素主导,如分层减弱后富CO2底层水上涌)。热力与非热力分量分解显示,春季pCO2峰值出现于升温过程,而后初级生产等非热力驱动导致夏季CO2消耗;秋季峰值则与降温背景下生物活动减弱及混合增强相关。
空间分布上,pCO2变异性与温度及环流驱动因子显著相关。7-8月空间差异最大,正值分层由近岸向湖心扩展。SHAP分析揭示输入参数重要性排序为:PAR(24 μatm)>LST(18 μatm)>初级生产力(16 μatm)>U10(2 μatm)。高初级生产力、高LST及强太阳辐射(负PAR值)均与pCO2下降相关。
2019-2023年净年通量在-0.30 Tg C yr-1(2023年最大吸收)至0.06 Tg C yr-1(2019年唯一逸散)间波动,五年均值为-0.14 Tg C yr-1,不确定性±0.06 Tg C yr-1。无冰期(儒略日100-300天)通量-0.22 Tg C yr-1与航测直接估算值(-0.3 Tg C yr-1)在误差范围内一致。
冬季pCO2过饱和虽受训练数据缺乏限制,但其时空模式(极值出现时间、持续期、幅度)与本顿顿等模型结果高度吻合,支持了重建结果在冰封期的合理性。
本研究净年通量估算(-0.30至0.06 Tg C yr-1)介于本顿顿模型(0.19 Tg C yr-1逸散)和兄弟与西布利推断值(-0.4 Tg C yr-1吸收)之间,显著缩小了先前碳预算的不确定性范围(-0.95至2.35 Tg C yr-1)。
碳收支平衡计算显示:碳输入(初级生产9.73 Tg C yr-1、出入流0.4-0.9 Tg C yr-1、大气沉降0.1-0.4 Tg C yr-1)与输出(沉积埋藏0.48 Tg C yr-1、群落呼吸9.5-12.0 Tg C yr-1)的差值应由湖-气通量平衡。本研究结果使该差值范围收窄,推动碳预算趋近闭合。
碳周转时间计算表明:苏必利尔湖溶解无机碳(DIC)库125 Tg C与有机碳库18.85 Tg C之和,相对于碳流出总量11.4 Tg C yr-1,周转时间为12.6年,介于DIC周转时间(3-5年)和溶解有机碳(DOC)周转上限(约60年)之间。
兄弟与西布利曾将1997-1998年强厄尔尼诺与1998-2001年净异养状态及CO2逸散增强关联。但本研究期间(2019弱厄尔尼诺→2020-2023中拉尼娜→强厄尔尼诺转型)却显示从CO2逸散(2019)向吸收(2020-2023)的转变,未支持厄尔尼诺-南方振荡(ENSO)与碳循环的简单关联。太平洋年代际振荡(PDO)负相位虽与1998-2001年相似,但五年数据过短,难以确认其遥相关作用。
本研究首次将神经网络应用于大湖碳循环重建,仅凭21%网格盒的有限观测(占可能日值的0.1%),成功捕捉全湖碳循环的季节与年际变异性。模型验证表明其具备外推能力,但冬季不确定性突出,需更多冰封期观测约束。
FFNN等机器学习模型虽能捕捉复杂非线性关系,但其"黑箱"特性阻碍过程机制解析。SHAP分析等可解释性工具可部分缓解该问题,揭示PAR、LST等参数通过代理效应(如空间异质性、混合动态)影响pCO2。未来可结合知识引导机器学习与地球系统模型杂交,提升模型透明性与过程表征能力。
本研究通过FFNN重建揭示了苏必利尔湖碳循环在季节与年际尺度上的动态平衡特征:五年间在净碳汇与碳源间波动,年均通量-0.14 Tg C yr-1。该结果显著优化了湖域碳预算估算,并凸显了大湖碳循环对气候变率的敏感性。
重建结果验证了冬季pCO2过饱和现象,但冰封期通量估算仍具较大不确定性。未来需结合越冬观测、改进气体传输参数化、拓展观测网络以提升模型精度。
机器学习重建技术为破解内陆水体碳循环观测难题提供了新路径。苏必利尔湖案例表明,即便在水体巨大、水文滞留时间长的系统中,碳循环仍呈现显著短周期变异性,这对区域乃至全球碳循环评估具有重要启示意义。
生物通微信公众号
知名企业招聘