
-
生物通官微
陪你抓住生命科技
跳动的脉搏
河流热浪加剧趋势超越大气热浪:对水生生态系统及水-能源-粮食安全的深远影响
【字体: 大 中 小 】 时间:2025年09月23日 来源:Proceedings of the National Academy of Sciences 9.4
编辑推荐:
本综述基于深度学习长短期记忆模型(LSTM)重建美国1471个河流站点1980–2022年连续水温数据,首次系统揭示河流热浪(RHW)频率、强度和持续时间均呈显著上升趋势,其增速为大气热浪(AHW)的2–4倍。研究强调气候变暖与积雪减少是主要驱动因素,人类活动(如水利工程与农业)起次要调节作用,呼吁将河流热浪纳入全球气候风险评估与适应政策。
河流热浪事件——即河流水温(WT)异常升高的时期——可显著损害水生生态系统、水质及粮食与能源生产。然而,受限于碎片化且不连续的水温数据,对河流热浪的系统分析仍处于起步阶段。本研究利用深度学习模型重建了美国1471个河流站点1980–2022年间一致的日尺度水温数据。结果表明,河流热浪事件发生频率和强度低于大气热浪,但持续时间近乎其两倍。令人警惕的是,河流热浪的上升速率远快于大气热浪。研究结果强调需加强对河流热浪的协同监测与数据整合,并将其纳入全球气候风险评估和适应政策。
尽管大气热浪常占据头条,河流热浪却因河流常被视作凉爽避难所而悄然被忽视。尽管水温监测传感器和卫星技术日益普及,但碎片化数据集阻碍了对河流热浪的分析。本研究通过训练单一深度学习模型(长短期记忆网络,LSTM),重建了美国本土连续且一致的日尺度水温数据(1980–2022年,1471个站点)。研究发现,河流热浪的发生频率约为大气热浪的一半(2.3 vs. 4.6 事件/年),强度为其三分之一(2.6 vs. 7.7 °C/事件),但持续时间近乎翻倍(7.2 vs. 4.0 天/事件)。河流热浪事件的增长速率是大气热浪的2至4倍,导致2022年相比1980年频率增加1.8事件/年、强度增加0.43 °C/事件、持续时间增加3.4天/事件,并为水生生态系统额外增加7至15个热应激日。在65%至76%的站点中,河流热浪的上升速度超过大气热浪,尤其在加速变暖的区域(如落基山脉)。河流热浪趋势主要受气候驱动因素如变暖和积雪减少、水流减少的影响,人类活动也扮演重要角色:大型水坝延长热浪,而农业活动减轻热浪。这些结果突显人为气候变化是主要外部驱动因素,而人类引起的结构变化是河流响应热干扰的次要内部调节因子。河流热浪的广泛上升威胁水生生态系统和水-能源-粮食安全,强调需对其进行全球特征描述和风险评估。
训练的模型基于常见指标表现出良好性能,包括Nash-Sutcliffe效率(NSE)、Kling-Gupta效率(KGE)、百分比偏差(PBIAS)和均方根误差(RMSE)。训练期和测试期的中位NSE值分别为0.99和0.98,KGE值分别为0.99和0.96,远超满意值0.5。训练期和测试期的PBIAS值分别为0.1%和0%,RMSE值分别为0.55 °C和0.73 °C,表明模型偏差和误差极小。尽管多数模型在极端事件中表现较差,但本模型在热浪期间表现同样优异。对于日流量,模型在测试期也表现良好,中位NSE、KGE、PBIAS和RMSE值分别为0.75、0.71、-8.6%和5.0 m3/s。在1471个站点中,1276个站点的NSE和KGE值超过0.8,PBIAS绝对值低于25%,RMSE在0.16至3.06 °C范围内,这些表现良好的站点被用于进一步的热浪分析。
模拟的水温凸显了水生生物热应激日的增加趋势。多数水生物种为冷血动物,其最适温度因物种、种群和生命阶段而异。部分物种可耐受高达20 °C的水温,但敏感物种如公牛鳟偏好低于15 °C的水域。本研究将“热应激”和“临界热应激”日分别定义为水温高于15 °C和20 °C的天数。全美年平均热应激日增加了11.6天(1980–2022年),东北地区增加最快(0.34 天/年),其次为落基山脉(0.32 天/年)和阿巴拉契亚地区(0.30 天/年)。这些趋势意味着2022年这些区域相比1980年分别增加了14.6、13.8和12.9天,远超过中西部地区的增加(5.2 天)。临界热应激日呈现不同模式,南部和阿巴拉契亚地区增加最快(15.1至16.3 天)。东北和落基山脉地区因典型水温低于20 °C,临界热应激日增加较慢(0.24 天/年)。热应激和临界热应激日在82%和74%的站点中显著增加(p ≤ 0.05)。
热浪特征呈现空间异质性。大气热浪在太平洋沿岸、落基山脉和东南地区发生更频繁、持续时间更长,但在美国北部强度更大。河流热浪在太平洋沿岸发生更频繁,在东部美国更频繁且强度更大,但持续时间无清晰空间模式。所有站点平均而言,河流热浪的发生频率为大气热浪的一半(2.3 vs. 4.6 事件/年),强度为其三分之一(2.6 vs. 7.7 °C/事件),但持续时间近乎翻倍(7.2 vs. 4.0 天/事件)。
热浪普遍变得更加频繁、强烈和持久。河流热浪在所有特征上均在美国大部分地区增加,仅在中西部和北部小区域下降。平均而言,河流热浪频率在约80%的站点增加,12%无显著变化,8%下降。增加最快发生在落基山脉和太平洋沿岸,但在集约农业的中西部区域下降迅速。相比之下,大气热浪频率在南部大片区域所有特征上增加,但在北部更大区域下降,45%、27%和28%的站点分别呈现增加、不显著和下降趋势。河流热浪持续时间在约62%的站点显著延长(p ≤ 0.05),强度和累积强度分别在54%和81%的站点增加。大气热浪持续时间在南部和西南地区增加最快,但在五大湖和中西部地区下降。大气热浪在南部大平原和东南美国强度增加最大,而河流热浪在落基山脉强度增加最大。大气和河流热浪强度分别在41%和28%的站点下降(p < 0.05,负趋势),主要发生在集约农业的中西部和五大湖区域。河流热浪在65%至76%的站点所有特征上增加速度快于大气热浪。全站点平均趋势显示,大气和河流热浪频率趋势分别为0.015和0.044 事件/年/年,持续时间趋势为-0.001和0.077 天/事件/年,强度趋势为-0.002和0.010 °C/事件/年,累积强度趋势为0.405和1.427 °C-天/年/年。换言之,大气热浪变得更为频繁,但持续时间和强度相对稳定,可能由于大量农业站点经历下降趋势。基于统计分布均值,河流热浪以2至4倍于大气热浪的速率增加。这些速率意味着2022年相比1980年,频率额外增加1.8事件/年,持续时间增加3.4天/事件,强度增加0.43 °C/事件。
1276个站点包括552个未开发(43%)、552个混合(43%)、145个城市(11%)和27个农业(2%)站点,基于美国地质调查局(USGS)分类。未开发站点在所有四类土地利用中呈现最快上升的大气和河流热浪所有特征,表明其尽管具有屏蔽变暖效应的能力,但缓冲能力有限。在农业站点,河流热浪通常更长、更强但频率略低于其他土地利用。大气热浪趋势下降或仅轻微增加。在城市站点,河流热浪更强但短于混合和未开发站点。混合站点通常介于未开发和农业站点之间;河流热浪相比未开发站点更长、更频繁和更强。总体而言,河流热浪频率和累积强度在城市站点增加更快,持续时间和强度在未开发站点增加更快。河流热浪频率在74%的站点增加快于大气热浪,顺序为城市(77%)> 未开发(74%)? 混合(74%)> 农业(67%)。其持续时间在75%的站点增加更快,顺序为未开发(88%)> 城市(73%)> 混合(64%)> 农业(63%)。其强度在66%的站点增加更快,未开发(80%)> 农业(70%)> 城市(55%)> 混合(53%)。年累积强度在76%的站点增加更快,城市(80%)> 混合(78%)> 未开发(74%)> 农业(74%)。
在52个属性中(包括静态土地属性和气候、水文及土地利用特征的趋势),使用BRT模型排名河流热浪趋势的影响驱动因子。气候驱动因子,尤其是最低和最高气温趋势,持续排名顶级驱动因子,并与热浪趋势正相关(红色)。紧随其后的是其他气候特征,包括冬季降水百分比(PPT%winter)和雪水当量趋势(SWEtrend),常与上升热浪负相关(蓝色)。地下水贡献,量化为水温和气温的振幅比(AR和ARtrend),也位列前五属性,强调更多地下水在缓冲变暖气候条件中的关键作用。低流量(低于5th百分位)特征趋势也排名前十,包括年低流量天数趋势(LFDp5-trend)、年平均流量(LFQp5-trend)和年平均流量短缺(LFSp5-trend) during low-flow days。地下特征如水位深度和土壤性质在一定程度上影响热浪趋势,尽管非主导。热浪趋势还受人类基础设施和活动如水坝和农业的塑造。特别是,水坝蓄水量(Damstorage)是延长热浪的最影响因子。混合和农业站点中河流热浪频率和强度趋势随农业用地百分比(Agri%)增加而下降,与中西部观察到的冷却趋势一致。然而,农业覆盖趋势并不重要,因为土地利用在过去几十年基本稳定。有趣的是,尽管城市热岛效应常被视为重要,但城市河流热浪主要受变化的气温和冬季降水驱动。开发区域百分比(Dev%)及其趋势仅对热浪频率趋势位列前五。
河流水温已被监测数十年,且已知在变暖气候中上升,但河流热浪研究仍在兴起。这与大气、湖泊和海洋热浪的广泛记录形成鲜明对比。此处通过重建超过千个站点在多样气候和土地利用条件下的连续日数据,系统性分析回答了关于河流热浪与大气热浪相比的特征、模式、趋势和驱动因子的问题。结果显示河流热浪相比大气热浪更不频繁和强烈但更长,且所有特征增加更快。影响驱动因子的分析潜在表明气候变化驱动河流-大气相互作用,是河流热浪的主要外部驱动因子。相比之下,人类活动塑造的土地结构如水坝和农业作为次要内部驱动因子,调节河流-土地相互作用,决定河流何时、何地及以何程度响应人为气候变化。
与河流是凉爽避难所的常见认知相反,河流热浪在65%至76%的站点中以2至4倍于大气热浪的速率增加。与湖泊热浪相比,它们类似长但强度较低。与类似定义(I类)的海洋热浪相比,河流热浪更不频繁和短但更强;它们频率和持续时间增加较慢但强度增加较快,尽管存在大不确定性。这些结果突显河流对热干扰的独特响应。不同于具有高热惯性的大水体,河流对热空气、水文变化和土地利用改变响应迅速,所有这些使其高度脆弱。
上升水温已被证明受气候和人类驱动因子调控,尽管孰强孰弱仍不明确。凭借超过千个站点在多样气候和土地利用条件下,此处分析明确显示气候变化是河流热浪趋势的直接主要驱动因子,尽管我们认识到气候变化本身由人类活动驱动。这呼应了气候控制许多其他水质变量的发现。最低气温趋势常位列顶部,可能因其相比最高气温增加更快。降水趋势,尤其是冬季降水和雪,也很重要,呼应了高海拔山脉中最快热浪增加。缩小的积雪减少了逐渐释放的凉爽融水提供的热缓冲,可加剧河流热浪。变化的水特征,包括地下水贡献和低流量趋势,也实质性影响河流热浪。河流热浪特征在减少地下水贡献(增加ARtrend)的站点增加最快。地下水对气温响应缓慢,并缓冲热空气对水温的影响。因此,具有更多地下水贡献的河流对气温变化较不敏感,而通过地表流和浅层地下水接收更多水的河流对气温波动更敏感。类似地,低流量减少流动水的热容量,延长水停留时间,并加剧河流热浪。
尽管次于气候驱动因子,农业和水坝特征实质性影响河流热浪趋势。主要农业区域如中西部观察到的冷却趋势呼应了生长季节全球气温下降,常归因于作物集约化(增加生产力)和灌溉。灌溉可对流量、地下水贡献和热浪产生深远影响。地下水源灌溉可能通过降低水位及其对径流的贡献而增加热浪。用于灌溉的河流分流可能减少流量并加热河流,而通过地下排水返回的灌溉流可改善河流变暖。水坝蓄水量与河流热浪持续时间的正相关表明大型水坝倾向于延长河流热浪。这与文献中观察相反,即水坝可增加或减轻河流热浪,取决于水坝位置、特征及放水时间和持续时间。例如,水坝或水库上游已观察到增加热浪持续时间。释放上部温暖epilimnion水可加剧但释放更深凉爽hypolimnetic水可抑制下游水温的季节变化。此处结果潜在表明,在具有大水量水坝中,停滞静水导致水温在深度持续增加,使得即使从水库底部释放的水仍加剧河流热浪。
鉴于观测和输入数据的可用性,此处结果不可避免在时间和空间上存在偏差。具有较长数据间隙或较短历史记录的站点具有较大不确定性。尽管如此,此处分析说明了LSTM模型在整合多样条件下空间碎片化和时间不一致数据中的优势,被称为文献中的“数据协同”。仅57个站点具有超过70%天覆盖的数据,传统单站点线性回归模型推荐的最小数据阈值。训练模型表现良好,即使在四十年中仅有100数据点的站点。训练模型可用于空间填充以重建无数据河流站点的水温数据,并用于具有相应输入数据的后报和预报。此处分析因此展示了构建LSTM模型以更广泛理解和预测水质在时间和空间中的前景。它们还可用于数据少得多的变量,扩展使用超越水温。事实上,其在预测溶解氧和总磷中的使用以及用于美国本土以外地方已被证明。
河流热浪相比大气热浪的更快增加可能正在全球发生,强调需要协同数据整合和更平衡监测网络。此外,它也指示更频繁共现的热水和低流量条件,可导致河流热浪和干旱的复合事件。这些条件常减少溶解氧水平并升高盐度, among many other water quality variables。这些条件可创造缺氧条件并对水生物种施加渗透压力。水生生物因此不仅经历热应激,而且经历水文和生物地球化学干扰。这些多重压力可加剧对水生生物的多方面威胁,潜在导致大规模鱼类死亡事件,这些事件仅开始被系统记录。河流热浪还危害水质和全球水、粮食和能源安全。随着气候变化加速,将河流热浪风险纳入气候适应策略和全球水治理框架对保护淡水生态系统和人类社会至关重要。
深度学习模型使用1471个USGS河流站点数据训练,这些站点在GAGES II数据库中具有流域属性。它们在1980–2022年间具有100至15,464个日水温测量值,平均3,405数据点,对应0.6%、98.5%和21.7%的天覆盖。
日平均水温和平均流量使用“dataRetrieval”包在2023年10月下载。气象数据是来自Daymet的遥感数据,包括日昼长、降水、短波辐射、雪水当量、最高和最低气温及水汽压。数据预处理在补充文本S3中描述。
来自GAGES II数据库的33个属性用于LSTM模型训练。它们包括气候、水文、地形、土壤、河流网络和土地利用属性。站点在流域面积、年平均气温、年平均降水、平均海拔和其他特征上变化。属性选择及其Pearson和Spearman相关系数在补充图S10和S11中详述。
LSTM模型是一种循环神经网络,克服传统循环神经网络中的梯度消失问题。一个“全局”LSTM模型使用所有站点数据训练,以预测日水温和日流量,使用日气象强迫和静态属性,代码适应hydroDL仓库。RMSE with equal weight to both WT and discharge was used as loss function。我们使用流量作为目标而非输入数据,因为流量数据相比遥感天气数据较不可用,并可限制训练模型用于有流量数据的站点。
为确保训练和测试数据均匀分布,具有水温数据的时间段为每个站点分割,使得较早时期具有75%数据作为训练期,而后期其余25%数据作为测试期。这种灵活分割先前已被用于确保跨站点最大空间和时间覆盖。训练和测试期因此因站点变化时空数据覆盖而异。训练期的开始设为具有流量数据的首日,如果它早于具有首水温数据的日期。
超参数按顺序调整,产生最优隐藏大小或神经元数256、序列长度365天和丢弃率0.3,给出最低中位测试RMSE值。为考虑固有随机性,校准模型然后使用五种不同种子运行,其均值用于进一步分析。
数据覆盖对训练稳健模型至关重要。LSTM以其利用来自许多站点的多样数据集能力而闻名。为训练尽可能多站点的单一模型,我们测试了两个版本:LSTM853模型使用853个站点,每个站点至少1825数据点(约12%覆盖),和LSTM1471使用1471个站点,每个站点至少100数据点。训练的LSTM853在853个站点中具有类似良好性能作为训练的LSTM1471。然而,当LSTM853用于预测在LSTM1471中但不在LSTM853中的618个站点水温时,中位NSE降至约0.71相比LSTM1471中的0.99,且33%站点NSE低于0.5。为最大化具有最佳模型性能的站点数,我们使用LSTM1471 with 100数据点阈值,先前已用于训练溶解氧的LSTM的阈值。增加阈值至500和1000将减少站点数至1322和1076。为进一步比较不同数据可用性站点的模型性能,我们选择了具有1%、10%、25%、50%、75%和88%数据覆盖的25个站点组。模型性能确实随更多数据可用性增加。然而,即使在仅有1%数据覆盖的站点中,中位NSE和KGE值高于0.5,并快速增加至约0.9在2.5%数据覆盖。
河流和大气热浪定义为当各自温度超过其相应本地、季节变化90th百分位阈值至少5和3天的事件。如果两个河流热浪事件(但非大气热浪)被低于阈值温度1或2天分隔,它们被视为单一事件。事件持续时间是温度超过其阈值的天数。平均事件强度是事件期间日温度与其历史日均值差异的均值,而非定义为峰值温度变化的最大事件强度。90th百分位阈值因儒略日而异,并使用43年(1980–2022)温度数据计算, thereby meeting the suggested guideline of using a minimum of 30-y long data records。大气热浪特征从Daymet的遥感日最高气温(流域面积中位)计算。河流热浪特征使用模拟日平均水温计算。所有特征使用“heat waveR”包计算。详细方程在补充文本S6中。尽管我们使用常用90th百分位阈值,不同阈值可导致事件特征的不同量化,尽管主要结论保持不变。我们量化了四个年热浪特征——频率、持续时间、强度和累积强度——为1980–2022年每一年。年频率是一年中事件总数;年持续时间(天/事件)是事件持续时间的平均;年强度(°C/事件)是一年中所有事件的平均事件强度的平均。年累积强度(天-°C/年)是一年中所有事件的事件持续时间和平均事件强度乘积之和。年频率、持续时间和强度在无热浪事件年份为零。趋势:热浪特征趋势量化为修正Sen’s斜率,使用Mann–Kendall检验 with trend free prewhitening over a 10-y running window。运行窗口帮助检测被年际变化掩盖的趋势。在无事件年份,年值为零。超过70%和80%站点显示大气和河流热浪特征的显著趋势(p ≤ 0.05)。具有不显著趋势的站点通常具有接近零值。因此,所有1276个站点的趋势被使用 irrespective of their significance。我们额外比较了从模拟和观测水温计算的河流热浪特征和趋势在53个具有至少75%数据覆盖(30年)的站点,热浪分析推荐阈值。来自测量和模拟数据的值大多在1:1线附近,具有类似范围且高度相关,表明来自模拟数据的趋势代表真实数据。
我们使用R包“XGBoost” for BRT模型以识别河流热浪趋势的影响驱动因子。BRT拟合若干分类和回归树 using stochastic gradient descent method, with each successive tree focusing more on improving predictions for poorly predicted instances。我们使用52个属性作为候选,包括来自GAGES II数据库的33个静态属性和19个额外趋势属性。更多细节在补充文本S8和S9中。
生物通微信公众号
知名企业招聘