在数据稀缺、光学环境复杂的内陆水域中,利用统计增强的遥感代理方法改进多时相溶解氧的估算

《Journal of Cleaner Production》:Improving the multi-temporal dissolved oxygen estimation using statistically enhanced remote sensing proxies in data-scarce, optically complex inland water

【字体: 时间:2026年01月13日 来源:Journal of Cleaner Production 10

编辑推荐:

  本研究提出一种基于卫星遥感和符号回归(SR)的内陆水体溶解氧(DO)动态估算框架,通过归一化水温(n-WST)和植被指数(NDVI)等光学活性参数间接推算DO。在恒河 Varanasi 段验证显示,SR 模型在2025年2月5日和11月26日测试集的MAPE分别为17.44%和18.12%,优于随机森林(21.26%)和支持向量回归(26.43%)。研究揭示了DO与温度的负相关及与叶绿素a的正相关关系,季节波动范围6.32-9.06 ppm,证实了SR在有限数据下的解释性和多时相泛化能力,为解决水质参数遥感反演难题提供了新范式。

  
作者名单:Shishir Gaur、Rajarshi Bhattacharjee、Shubha Shivani、Venu Banoth、Anurag Ohri、Dheeraj Joshi、Shard Chander
印度理工学院(BHU)土木工程系,瓦拉纳西,221005,印度

摘要

由于缺乏光谱特征,通过遥感技术监测光学上不活跃的水质参数(如溶解氧DO)面临重大挑战。传统的现场测量方法仅能提供点状数据,且空间覆盖范围有限。本研究提出了一种新的遥感框架,用于内陆水体中溶解氧的多时相连续估算。该框架在印度瓦拉纳西的恒河上进行了验证。该方法利用卫星获取的标准化水面温度(n-WST)和标准化植被指数(NDVI)作为关键代理指标。符号回归(SR)因其建模效率和能够在数据量有限的情况下生成可解释的数学关系而被选中。在2025年2月5日的测试数据集上,SR模型的平均绝对百分比误差(MAPE)为17.44%;应用于2025年11月26日的卫星数据时,MAPE为18.12%,显示出良好的多时相泛化能力。使用2025年11月26日的数据集训练的随机森林(RF)和支持向量回归器(SVR)在测试数据集上的MAPE值分别为21.26%和26.43%。基于卫星的季节性分析显示,溶解氧浓度在夏季为6.32 ppm,冬季升至9.06 ppm。该框架强调了通过溶解氧-温度反比关系进行热力学控制的重要性,同时捕捉了溶解氧与叶绿素-a之间的正相关关系以及空间-时间异质性。通过将可解释的机器学习技术与遥感代理指标相结合,该框架解决了数据稀缺和某些水质参数缺乏光谱特征的问题,为利用卫星数据监测水质参数提供了一个可扩展且有效的方案。

引言

光学上不活跃的水质参数,如溶解氧、营养物质(例如硝酸盐、磷酸盐)和某些病原体,不会显著改变水的光学性质,因此无法直接通过遥感技术检测到。这些参数在可见光到近红外范围内缺乏独特的光谱特征,需要通过它们与光学活性指标的相关性进行间接估算(Sagan等人,2020a, 2020b;J. Xiong等人,2020)。在这里,我们将溶解氧(DO)作为一种光学不活跃的参数进行估算。氧气与温度一起,是影响内陆水体生态功能的最关键环境变量之一。溶解氧是河流生态系统生态健康的基本指标,因为它支持水生生物(包括鱼类、无脊椎动物和微生物群落)的有氧呼吸(Oldham等人,2019;Burt等人,2012)。充足的溶解氧水平对于维持生物多样性、养分循环和整个生态系统的功能至关重要。溶解氧的波动通常由温度、流量变化和有机污染驱动,可能导致缺氧状况,从而对敏感物种造成压力或致命影响。在淡水生态系统中,持续准确的溶解氧监测对于评估生态系统健康状况和防止可能导致生态退化和危及水生生物生命的缺氧情况至关重要(Chi等人,2020)。 传统的溶解氧监测通常依赖于现场传感器,这些传感器可以手动部署或通过半自动化系统进行部署(Parra等人,2018)。虽然这些方法对于点状测量有效,但往往受到空间覆盖范围有限和操作挑战的制约。随着水资源管理向实时、数据密集型策略转变,对具备自动化和预测能力的可扩展解决方案的需求日益增加(O’Donncha和Grant,2020;Raju和Varma,2017)。然而,值得注意的是,溶解氧是一种光学不活跃的参数,无法通过遥感载荷检测到(Guo等人,2021;Kim等人,2020)。遥感技术提供了一种有前景的替代方案,可以通过表面温度和叶绿素a等光学活性指标间接估算溶解氧。这种方法在内陆水系统中特别有价值,因为这些地区的直接测量基础设施可能不足或不一致。 溶解氧(DO)通常与水温呈反比关系,即温度越高,氧的溶解度越低(Matear和Hirst,2003)。因此,地表水中的溶解氧浓度会随季节变化,在较冷的月份(如冬季和早春)浓度较高,而在温暖的夏季浓度较低。叶绿素a与溶解氧呈正相关。在淡水河流系统中,初级生产力是影响溶解氧浓度的重要因素。遥感技术经常使用叶绿素a浓度作为初级生产力的代理指标,因为它反映了地表水中浮游植物和藻类的丰度(Guy等人,1993;Lewis等人,2016)。在白天,这些光合生物会产生氧气,导致溶解氧与叶绿素a浓度呈正相关。这种关系在水面上层最为明显,并随河流流量条件、季节模式和主要藻类种类而变化。已有研究记录了恒河中浮游植物的出现和季节性模式。在各个地点观察到的主要藻类群包括绿藻门、硅藻门、蓝藻门和眼虫门(Khanna,1993;Tare等人,2003)。 为了提高基于遥感的溶解氧预测精度,本研究采用了特定于水的大气校正方法来推导出水的反射率,这与大多数依赖表面反射率的水质研究不同,后者可能包含太阳反射光的影响(Din等人,2017;Elsayed等人,2021;Gad等人,2022;Rahul等人,2023;Rahat等人,2023;Maciel等人,2023;Loaiza等人,2023;Rajaveni等人,2024;Rodrigues等人,2025)。遥感数据集的另一个问题是尽管进行了大气校正,仍然存在残余噪声(Sahoo等人,2022;Li等人,2019;Shi等人,2020)。本研究通过分别对光学和热波段使用稳定的陆地像素对水像素进行标准化,从而减少了残余噪声。此外,河床的反射率也会影响基于遥感的水质研究的准确性。然而,本研究并未明确去除河床的反射率影响,因为恒河被认为是光学上较深的(Gaur等人,2025)。 在各种水技术应用中,统计分析和机器学习(ML)在泄漏检测、径流预测、海水淡化和废水管理等领域表现出强大性能(Ahmed等人,2024a;Ahmed等人,2024b;Lowe等人,2022;Huang等人,2021;Ghobadi和Kang,2023;Alprol等人,2024)。在预测溶解氧(DO)方面,许多研究探索了机器学习(ML)模型,显示出针对特定地点的强大性能,但也揭示了关键局限性。Zhao和Chen(2025)开发了一种混合DWT-KPCA-GWO-XGBoost模型,在三个河流站点上的表现优于其他ML模型,而Karata?等人(2025)发现XGBoost在水产养殖环境中的准确性最高。Guo等人(2021)表明,使用遥感代理的支持向量回归(SVR)模型在用现场数据验证时具有很高的鲁棒性。然而,研究一致指出,模型性能会因地点和时间段而异,像多层感知器(MLP)和长短期记忆(LSTM)这样的模型根据局部环境因素的不同表现出不一致的结果,需要大量调整(F. H. Garabaghi等人,2023;Gachloo等人,2024;Fang等人,2025)。尽管在可解释性方面有所进步,例如使用SHapley Additive Explanations(SHAP)图来解释SVR和MLP模型,但大多数ML方法的基本黑箱性质仍然存在,它们在多时相时间线上的泛化能力仍然有限(Li等人,2024;Abba等人,2020;Guo等人,2021;Gachloo等人,2024)。此外,虽然ML模型可以在几百个样本点上进行训练,但深度学习(DL)模型通常需要包含数千个样本的大规模数据集才能获得可靠的模型精度(Kay等人,2023;Zahiri等人,2025)。这些局限性突显了需要寻找能够在解释性、时间泛化能力和计算效率之间取得平衡的替代机器学习范式的必要性。符号回归(SR)可以作为一种可能的解决方案来应对这些限制。 SR即使在训练数据有限的情况下也能有效寻找关系。事实上,SR最初是通过遗传编程推广开来,专门用于处理样本量有限的科学数据建模(Makke和Chawla,2024)。Derner等人(2020)指出,即使训练样本量低至50个数据点,SR也能保持准确性和可解释性。重要的是,SR能够自动平衡模型复杂性和数据拟合度,通常产生的方程能够避免过拟合。近年来,SR在各个领域的应用有了显著发展(Angelis等人,2023a,Angelis等人,2023b;Guo和Yin,2024;Bahador和Pong,2025);然而,其在水质研究中的应用仍然有限,目前尚未有关于溶解氧的应用研究。 据我们所知,本研究是首批利用SR从遥感代理指标量化溶解氧的研究之一。此外,该研究也是少数分析内陆水体中多时间戳溶解氧波动的研究之一。本研究探讨的问题是:在像恒河这样具有非线性季节性溶解氧浓度动态的光学复杂河流系统中,整个框架研究溶解氧变化的可靠性如何?

研究区域

恒河是世界第二长和第二大流量的河流,发源于喜马拉雅山脉南坡的冈戈特里冰川,海拔高度为4100米(相对于平均海平面MSL)。巴吉拉蒂河发源于加尔瓦尔喜马拉雅山脉的Gaumukh冰洞,被认为是原始的恒河,而阿拉克南达河在德夫普拉亚格与巴吉拉蒂河汇合。恒河流域的集水区覆盖...

现场采样

2025年2月5日在瓦拉纳西市周边的恒河段进行了密集采样。采样从上午8:30开始,大约在中午12点结束,期间因物流问题短暂中断。在这里,恒河从南向北流动。采样不是沿着河流中心线进行,而是通过船只左右交替移动来进行,以捕捉最大的溶解氧变化...

方法论

该方法首先获取研究区域的Landsat-8/9 TOA辐射度和第10波段LST产品。通过ACOLITE对TOA辐射度进行大气校正,以获得相关波段的水反射率(ρ_w)。接下来,使用变异系数(CV)作为指标,在场景中识别出一个稳定的参考陆地像素(L),即多个日期中反射率变化最小的陆地像素被认为是最佳的...

稳定陆地像素的选择

图3展示了用于标准化卫星反射率和表面温度的最稳定的陆地像素的空间识别。在(b)面板中,显示了光学波段(红色和近红外)最稳定的像素(坐标为83.014 E, 25.316 N)[a面板]。这是因为像混凝土和沥青这样的建筑表面不会像植被或水体那样经历季节性变化...

未来工作

虽然本研究证明了符号回归在从多光谱遥感数据中推导溶解氧算法方面的有效性,并且具有相当的精度,但该方法本质上只捕捉了控制河流溶解氧动态的生物地球化学过程的一个子集。溶解氧浓度受多种相互作用因素的影响,而不仅仅是叶绿素a和温度,还包括水动力过程(流速和湍流)、有机物分解(生化氧气...

结论

本研究表明,当符号回归与标准化的遥感代理指标结合使用时,可以为光学复杂的内陆水体提供稳健且可解释的溶解氧估算框架。通过利用稳定的陆地像素来最小化残余噪声,并使用遥感代理指标作为预测因子,该方法实现了空间连续和多时相的溶解氧映射,克服了传统现场方法的局限性以及光学不活跃参数缺乏光谱特征的问题...

CRediT作者贡献声明

Shishir Gaur:撰写——审稿与编辑、监督、方法论、概念化。Rajarshi Bhattacharjee:撰写——初稿、软件开发、方法论、形式分析、概念化。Shubha Shivani:形式分析、数据管理。Venu Banoth:软件开发、形式分析、数据管理。Anurag Ohri:撰写——审稿与编辑、监督、概念化。Dheeraj Joshi:撰写——审稿与编辑、概念化。Shard Chander:撰写——审稿与编辑、监督...

数据可用性声明

本研究中使用的LANDSAT数据集可在https://earthexplorer.usgs.gov/处获取。
代码可在https://github.com/rajbhatt1302/Dissolved-Oxygen-using-SR.git处获取。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了印度空间研究组织(ISRO)通过资助ISRO/RAC-S/IIT(BHU)2022-23的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号