基于机器学习的地下水中有毒石油烃的现场检测方法

《Journal of Contaminant Hydrology》:Machine learning-based in-situ detection of toxic petroleum hydrocarbons in groundwater

【字体: 时间:2025年11月04日 来源:Journal of Contaminant Hydrology 4.4

编辑推荐:

  本文提出一种基于低成本传感器(pH、溶解氧、电导率、氧化还原电位)的机器学习框架,通过反应传输模型生成虚拟数据验证其有效性。研究发现随机森林和XGBoost模型在预测苯系物污染迁移中表现最佳,但传感器噪声(10-20%)和季节性波动显著影响模型精度,需结合硬件稳定化与自适应平滑技术优化检测。该框架为地下水污染实时监测提供了可行方案,但需进一步实地验证。

  石油烃污染是地下水污染的一个重要问题,尤其是在工业、交通和住宅等领域广泛使用的环境中。由于污染物质的扩散和降解过程受到多种因素的影响,传统的监测方法往往需要定期进行人工采样和实验室分析,这不仅成本高昂,而且难以实现实时监控。为了应对这一挑战,研究人员提出了一种基于机器学习(ML)的地下水实时监测框架,旨在通过低成本的现场传感器数据,对苯、乙苯和甲苯(BEX)污染进行早期预警。这一框架利用了pH值、溶解氧(DO)、电导率(EC)和氧化还原电位(ORP)等现场水质参数,这些参数与污染物浓度之间存在一定的相关性。

在实际应用中,BEX污染物的检测通常依赖于特定的阈值,例如美国环境保护署(EPA)规定的5 μg/L。然而,现场传感器数据通常存在噪声和季节性波动,这些因素可能会影响监测系统的准确性。因此,研究团队通过模拟含水层中的反应传输模型(RTM)生成了虚拟数据集,并在此基础上对不同的ML分类器进行了评估。实验中使用的分类器包括逻辑回归(LR)、随机森林(RF)、XGBoost(XGB)、多层感知机(MLP)和支持向量分类器(SVC)。这些模型被用于预测BEX在虚拟下游监测井中的浓度变化,并识别可能的污染事件。

研究发现,尽管在没有噪声的情况下,大部分模型都能在BEX浓度达到阈值之前发出预警,但当引入传感器噪声时,模型的性能显著下降。特别是对于复杂模型如MLP,噪声对模型的影响更为明显,导致了更多的误报和漏报。因此,为了提高模型的鲁棒性,研究团队推荐结合硬件稳定性和自适应平滑技术。这些技术可以帮助过滤掉数据中的噪声,从而提升模型的预测能力。

此外,研究还考虑了季节性波动对现场水质参数的影响。通过在训练数据中引入正弦波动,模拟了清洁上游地下水成分的季节性变化。结果显示,线性模型如LR和SVC在面对季节性波动时表现相对稳定,而复杂的模型如XGB、RF和MLP则对波动更为敏感。这种敏感性可能使得模型将噪声误认为实际的污染信号,从而影响其准确性。

为了应对这些挑战,研究团队测试了不同的数据平滑方法,包括3天、5天和10天的移动平均值。结果显示,5天的移动平均值在减少噪声影响的同时,仍能保持对污染信号的敏感性。这种方法在一定程度上提高了模型的稳定性,使其能够在更复杂的条件下准确预测污染事件。然而,季节性波动可能需要不同的处理方式,例如使用傅里叶分解或小波变换等技术,以区分周期性趋势和实际的污染信号。

研究的结论表明,虽然当前的ML框架在模拟环境中表现良好,但在实际应用中仍需进一步的验证和优化。这包括对不同含水层特性的适应性调整,以及对传感器数据质量的持续监控和处理。为了确保模型的长期有效性,所有部署的系统都需要具备持续学习的能力,以便根据新的传感器数据和变化的含水层条件进行调整。

总体而言,这项研究展示了通过现场传感器数据和机器学习技术进行地下水污染早期预警的潜力。虽然存在一定的技术挑战,如传感器噪声和季节性波动,但通过合理的数据预处理和模型优化,可以显著提高监测系统的可靠性和准确性。未来的研究应进一步探索在真实环境中部署这些技术的可能性,以实现更高效、经济的地下水污染监测方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号