
-
生物通官微
陪你抓住生命科技
跳动的脉搏
LSTM内部水文概念与降雨-径流关系的异步性演化及其对物理一致性预测的影响
【字体: 大 中 小 】 时间:2025年05月23日 来源:Environmental Modelling & Software 4.8
编辑推荐:
本研究针对LSTM在流域尺度大样本数据中学习"降雨-径流"关系与水文概念的异步性问题,通过渐进式扩展训练集规模,结合线性探针(probe)技术映射LSTM细胞状态(cell state)与土壤含水量(SWV)、雪水当量(SD)等水文概念的关系。发现LSTM对水文概念的形成早于对降雨-径流关系的完整表征,且存在最优训练集规模(LSTMdist91),此时模型在未观测流域和气候变暖情景下均能保持物理一致性预测,为深度学习水文模型的可解释性研究提供新视角。
水文建模领域长期面临过程模型(process-based models)与数据驱动模型的优劣之争。近年来,长短期记忆网络(LSTM)在大样本流域数据中展现出超越传统水文模型的预测精度,但其物理一致性和可解释性始终存疑。特别是在气候变暖情景和跨流域预测时,LSTM常产生违反水热平衡原理的预测结果。这种矛盾现象的核心在于:LSTM是否真正学习到普适性的水文物理规律?其内部状态是否隐含可解释的水文概念?
为解开这一谜题,研究人员以美国东部281个流域为研究对象,设计了两组渐进式训练实验:基于空间距离(Experiment 1)和流域相似性(Experiment 2)逐步扩展训练集。通过连接LSTM细胞状态与线性回归模型(称为probe),实时监测模型对土壤含水量(swvl1-swvl4)和雪水当量(SD)等水文概念的捕获程度。测试阶段不仅评估常规径流预测的纳什效率系数(NSE),还设计4种变暖情景(+1°C至+4°C)检验模型物理一致性。
关键技术包括:1) 采用包含32个特征(5个气象强迫和27个流域静态属性)的CAMELS数据集;2) 构建64维LSTM网络,通过弹性网络正则化(elastic net)训练probe映射细胞状态与水文概念;3) 采用Mahalanobis距离量化流域相似性;4) 通过总径流比分析气候变暖下的水热平衡响应。
4.1 实验1 - 基于空间距离的建模
当训练集包含91个流域时(LSTMdist91),模型对水文概念的捕获达到峰值(土壤水相关系数中位数0.71),此时径流预测NSE为0.61;当训练集扩大至275个流域时(LSTMdist275),NSE提升至0.64但水文概念表征反而下降。在6个未参与训练的流域测试发现,LSTMdist91在变暖情景下全部保持径流比递减的物理规律,而LSTMdist275在50%流域出现反常预测。
4.2 实验2 - 基于流域相似性的建模
以Mahalanobis距离筛选71个相似流域训练时(LSTMattr71),模型同时达到最佳水文概念表征(NSE 0.58)和接近最优的径流预测。细胞状态分析显示,第59维(cell 59)与土壤水、第15维(cell 15)与雪水当量呈现强相关性,且这种对应关系在两组实验中保持一致。
5.2 水文概念与细胞状态动力学
研究发现LSTM细胞状态中存在大量未利用维度(如cell 62相关系数接近0),暗示其可能编码未知水文过程信息。高纬度流域中cell 15与SD的强相关性(r>0.8),以及季风区流域中cell 59与土壤水的滞后响应,证实LSTM确实学习到符合地理特征的水文动态。
这项发表在《Environmental Modelling》的研究揭示:LSTM在扩展训练过程中存在"水文概念先熟"现象,其细胞状态形成的水文知识库早于完整的降雨-径流关系。当模型达到最佳水文概念表征时(LSTMdist91/LSTMattr71),即便径流预测精度非最优,也能在未知流域和极端气候下保持物理一致性。这一发现为平衡深度学习模型的精度与可解释性提供了量化标准——通过监测细胞状态与关键水文概念的映射强度,可识别模型的最佳训练阶段。研究同时指出,传统仅以NSE评价模型性能的做法可能筛选出"过拟合"物理规律的次优模型,这对水文机器学习模型的评估范式具有重要启示意义。
生物通微信公众号
知名企业招聘