
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于LSTM-CNN混合框架的水质监测FDOM预测模型:结合SHAP分析提升可解释性
【字体: 大 中 小 】 时间:2025年07月17日 来源:Process Safety and Environmental Protection 6.9
编辑推荐:
推荐:针对传统水质评估方法成本高、耗时长的问题,研究人员开发了LSTM-CNN混合深度学习模型,结合SHAP分析预测荧光溶解有机物(FDOM)浓度。该模型在美国俄勒冈州两个USGS监测站的数据测试中表现优异(R达0.989),DO、pH等参数被识别为关键影响因素,为水质智能监测提供了高效可靠的新工具。
水资源的保护与监测是维系人类生存和生态平衡的核心议题。随着工业化和城市化进程加速,水体污染问题日益严峻,传统实验室检测方法却面临成本高、时效性差的困境。荧光溶解有机物(FDOM)作为反映水质的关键生物标记物,其浓度变化直接影响水体透明度和全球碳循环,但现有技术难以实现快速精准预测。
针对这一挑战,研究人员创新性地构建了混合深度学习框架LSTM-CNN(长短期记忆网络-卷积神经网络),结合SHAP(Shapley Additive Explanations)可解释性分析,对美国地质调查局(USGS)俄勒冈州两个监测站(14211720和14203500)的长期水质数据进行建模。研究整合了包括水温(Tw)、溶解氧(DO)、叶绿素a(Chl-a)等7项水质参数及时间特征,通过九种不同输入场景的系统对比,验证了该模型在FDOM预测中的优越性。相关成果发表在《Process Safety and Environmental Protection》期刊。
关键技术方法包括:1) 采用多模型对比策略,测试LSTM、GRU、CNN等6种神经网络架构;2) 设计双层混合框架,先通过LSTM捕捉时序特征,再用CNN提取空间模式;3) 引入SHAP值量化各参数贡献度;4) 使用RMSE、NSE等四项指标评估性能。数据来源于USGS监测站2014-2021年的日尺度观测记录。
【结果】
模型性能比较:在USGS 14203500站,LSTM-CNN的预测精度(R=0.965)显著优于单一模型,RMSE和MAE分别低至2.867 ppb QSE和1.641 ppb QSE;在USGS 14211720站表现更优(R=0.989)。
特征重要性:SHAP分析揭示溶解氧(DO)、pH值、浊度(TU)和叶绿素a(Chl-a)是影响FDOM浓度的核心参数,其中DO在多数模型中贡献度超过30%。
时序预测能力:混合模型成功捕捉到FDOM的季节性波动和突发污染事件响应,在暴雨径流等非线性场景下仍保持稳定。
【讨论与结论】
该研究突破了传统水质评估的局限性,首次将可解释AI技术应用于FDOM预测领域。LSTM-CNN框架通过融合时序建模与空间特征提取能力,实现对复杂水环境系统的精准模拟。实践层面,该模型可部署为实时监测预警系统,帮助环保部门在污染发生前采取干预措施。理论层面,SHAP分析揭示了水体光学特性与生物化学参数的深层关联,为碳循环研究提供了新视角。相比既有研究,该方法将预测效率提升40%以上,且无需昂贵的光谱设备,特别适合发展中国家水资源管理需求。未来可通过迁移学习扩展至重金属、微生物等更多水质参数的预测,推动智能水环境监测体系的全面发展。
生物通微信公众号
知名企业招聘