利用基于机器学习的虚拟传感器来实现高频营养监测,从而推进可持续发展目标6.3.2的实现

《Journal of Water Process Engineering》:Advancing SDG 6.3.2 with machine learning-based virtual sensors for high-frequency nutrient monitoring

【字体: 时间:2025年10月08日 来源:Journal of Water Process Engineering 6.7

编辑推荐:

  可靠监测水体中氮和磷浓度对实现可持续发展目标6.3.2至关重要,但高成本传感器限制了全球数据覆盖。本研究提出一种基于机器学习的虚拟传感框架,用低成本的溶解氧、pH、电导率(基础特征)结合浊度、温度、流量(增强特征)预测氮磷浓度,并应用REFORMS清单确保方法透明性和可重复性。实验表明,在复杂城市流域(The-Cut)和稳定农村流域(River-Enborne)中,增强特征使模型R2分别达到0.88和0.98,RMSE低于0.1 mg/L,满足SDG合规性要求(R2≥0.7)。SHAP分析显示电导率和浊度是主要驱动因素,验证了模型可解释性。该框架通过减少传感器部署和实验室分析成本,为LMICs提供可扩展的水质监测解决方案,并建议通过试点验证和标准化政策推动实际应用。

  在这项研究中,科学家们探讨了如何通过虚拟传感技术来提升对氮和磷的监测能力,尤其是在资源有限的地区。联合国可持续发展目标(SDG)6.3.2要求定期监测水体的环境质量,但高昂的现场传感器成本限制了全球数据覆盖,特别是在低收入和中等收入国家(LMICs)中。因此,研究人员开发了一种基于机器学习(ML)的虚拟传感框架,利用成本较低的基础特征(如溶解氧、pH值和电导率)以及低成本的补充特征(如浊度、温度和流量)来预测水体中的氮和磷浓度。

研究的创新之处在于首次将REFORMS清单整合到虚拟传感的全过程中,确保模型开发的透明性、可重复性和政策相关性。通过对多种机器学习算法的比较,研究选择了Extra Trees(ET)作为表现最佳的模型,并通过严格的基准测试、随机抽样检查和超参数调优(如网格搜索、随机搜索和贝叶斯优化)来提升模型的性能。结果表明,ET模型在不同城市和农村流域中均实现了较高的预测准确性,最高达到R2值0.98,这表明该模型能够有效捕捉水体中氮和磷的动态变化。

研究还通过SHAP分析对各特征的贡献进行了深入探讨。分析结果显示,电导率和浊度是预测氮和磷浓度的主要驱动因素。这些特征在不同环境中的表现各异,例如在城市流域中,由于水体受多种人类活动影响,仅依赖基础特征可能无法达到所需的预测精度,而加入浊度和温度可以显著提升模型性能。相比之下,农村流域由于环境条件较为稳定,仅需基础特征即可实现SDG合规的精度水平。

从实际应用的角度来看,这项研究为政策制定者和环境机构提供了重要的参考。例如,建议通过等效性测试指南来增强虚拟传感器的可信度,并通过能力建设支持国家监测计划。此外,研究还强调了在不同流域中应采取差异化的特征选择策略,以确保模型在复杂环境中仍能保持较高的准确性。这种灵活的框架不仅有助于缩小氮和磷数据的差距,还能支持可持续发展目标的实现。

研究还对数据预处理方法进行了系统评估,包括缺失值处理、数据转换(如偏度修正)和特征缩放。结果显示,列表删除法在保留数据完整性方面表现最佳,尤其是在数据缺失模式与观察值相关的环境中。同时,不同的缩放方法对模型性能的影响有限,但某些敏感模型(如贝叶斯岭回归和K近邻)在特定缩放方法下性能波动较大。因此,研究建议在数据预处理阶段采用统一的策略,并确保模型在实际应用中保持稳定性。

此外,研究还探讨了异常值处理策略对模型性能的影响。结果显示,保留异常值通常能获得更高的模型性能,因为这些值可能反映了真实的环境变化。相比之下,移除或限制异常值可能会导致模型性能下降,尤其是在数据存在噪声和冗余的情况下。因此,研究建议在虚拟传感系统中保留异常值,以确保模型的生态有效性。

研究的另一个重要发现是,特征组合对模型性能的影响显著。在城市流域中,仅使用基础特征的模型预测精度较低,而加入浊度和温度后,模型性能显著提升,达到SDG合规的R2阈值(≥0.70)。相比之下,农村流域在仅使用基础特征的情况下即可实现高精度,加入其他特征带来的提升相对较小。因此,研究建议在资源有限的地区优先考虑加入浊度和温度传感器,以在保证成本效益的同时提高预测精度。

总体而言,这项研究不仅在技术层面为虚拟传感提供了可行的解决方案,还在政策和方法论上提出了具体的建议。通过结合低成本传感器数据和机器学习模型,研究为实现SDG 6.3.2目标提供了新的工具和思路,特别是在那些无法负担昂贵现场传感器的地区。未来的研究可以进一步探索该框架在不同流域和环境条件下的适用性,并通过多流域试点部署来验证其在实际环境中的效果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号