使用XGBoost和进化编程技术识别沉积物塑料污染的热点区域

《Environmental Pollution》:Using XGBoost and Memetic Programming to Identify Hotspots of Sediment Plastic Pollution

【字体: 时间:2025年10月31日 来源:Environmental Pollution 7.3

编辑推荐:

  塑料污染治理中,机器学习模型(XGBoost和Memetic Programming)结合地理空间分析,研究了喀麦隆雅oundé Mfoundi子流域地形、水文及城市参数对自然和人为塑料热点的影。结果显示地形和水利因素(如坡度、流量累积、降雨强度)对热点形成影响更大,城市参数(人口密度、道路距离、废物管理)对人为热点更具预测力。多参数协同模型(精度≥75%)显著优于单一参数,MP算法在泛化能力上优于XGBoost,验证了复杂环境问题中混合模型的适用性。

  在全球范围内,塑料污染已成为一个日益严峻的环境问题。尽管国际社会对可持续塑料管理的重视程度不断提高,但目前仍不足10%的塑料废弃物被有效回收,这导致了塑料在环境中的广泛扩散和污染。本研究聚焦于喀麦隆首都雅温得的Mfoundi流域,探讨地形、水文和城市因素对塑料热点(包括宏观塑料)形成的影响,旨在为塑料污染的精准干预提供科学依据。研究采用了极端梯度提升(XGBoost)和膜编程(Memetic Programming, MP)两种机器学习算法,基于十二个空间明确的参数对人类活动和自然形成的塑料热点进行分类,并通过五个关键指标评估模型的性能:准确率、灵敏度、特异性、正预测值(PPV)和负预测值(NPV)。研究结果表明,地形和水文因素对塑料热点的形成具有更强的影响,而城市变量的影响相对较小。在人类活动相关的热点中,人口密度、道路距离和废弃物管理基础设施与热点的形成密切相关,而土地利用类型对整体影响有限。当多个参数被结合使用时,模型的性能显著提升,准确率达到了75%以上。此外,MP算法在测试数据集上的泛化能力更强,而XGBoost则表现出一定的过拟合现象。这些发现突显了空间明确的机器学习模型在指导塑料污染治理中的重要性。

### 研究背景与意义

塑料垃圾对环境的危害日益凸显,不仅影响水体资源、土壤质量、大气颗粒物,还对水生和陆生生物的健康构成威胁。尽管全球范围内已采取多种减缓措施,但塑料的生产量仍在持续上升,且预计未来污染趋势将更加严峻。据联合国环境规划署和世界银行等机构的数据显示,全球仅有约10%的塑料被有效回收,特别是在基础设施不足的发展中国家,这一比例更低。塑料垃圾的来源既包括人类直接倾倒,也可能是由自然因素如风、降雨、径流和水流等引起的。在环境中,塑料垃圾可以形成三种类型:人类活动热点(如垃圾堆积点)、自然热点(由地形和水文条件驱动形成)以及孤立的非点源垃圾。人类活动热点通常与城市变量如人口密度和废弃物管理设施密切相关,而自然热点则更多受到地形和水文因素的影响。塑料热点的持续存在依赖于其所在位置以及自然或人工屏障的存在,它们可能处于稳定状态,也可能在水文事件的影响下重新迁移。即使是人类活动产生的塑料垃圾,如果未能及时清理,也可能在水文和地形因素的影响下迁移到自然热点或非点源区域。

### 研究区域概况

雅温得是喀麦隆的政治中心,也是该国最重要的城市之一,当前估计人口约为450万。该城市位于海拔约750米处,地形起伏较大,主要由Mefou流域排水,该流域面积约为805平方公里。流域内的高地在雨季会通过较小的河流,如Mfoundi河,将水流汇聚至Mefou河,最终汇入Nyong河。雅温得的多山地形常导致暴雨期间发生山洪,对城市环境造成影响。该城市具有典型的赤道湿润气候,年平均气温为23.5°C,年均降雨量为1700毫米。降雨期约为七个月(3月至6月和9月至11月),而干季则持续约五个月(12月至2月和7月至8月)。流域内的土壤类型多样,从山顶和坡地的铁质土壤到低洼地区的水成土壤和可淹没的沼泽地。Mfoundi流域西北和南部区域主要覆盖绿色植被、农田、裸露地面和少量放牧区。Mefou流域作为Nyong河流域的一部分,总面积达27,800平方公里,是喀麦隆第二大的河流流域,仅次于Sanaga河流域(面积140,000平方公里)。

### 研究方法

本研究采用了一种结合地理信息系统(GIS)和机器学习的方法,以评估地形、水文和城市参数对塑料热点形成的影响。研究流程分为三个主要阶段:数据收集与处理、实地调查与塑料热点图绘制,以及使用XGBoost和MP算法进行分类和性能评估。数据收集与处理阶段,研究团队识别了十二个关键的环境参数,分为地形、水文和城市三类。这些参数包括地形参数(如地形湿润指数、高程、坡度和距离到河流)、水文参数(如径流累积、排水密度、日最大降雨量和平均风速)以及城市参数(如土地利用、人口密度、距离到道路和废弃物管理基础设施)。通过ArcGIS Pro软件,研究团队从数字高程模型(DEM)数据中提取了这些参数的值。

### 实地调查与热点图绘制

2024年8月4日至30日期间,研究团队在Mfoundi流域的七个行政区域进行了实地调查,使用Garmin Etrex GPS设备和Kobo Collect工具记录了塑料垃圾热点的空间位置和特征。热点被分为两类:自然热点和人类活动热点。自然热点是由水文和地形因素驱动形成的,而人类活动热点则主要由人类直接倾倒或垃圾管理不当引起。研究团队共记录了347个热点(详见补充材料中的图S5),并对这些热点进行了现场拍照和描述,收集了有关垃圾类型、积累背景和周围土地利用的元数据。根据研究团队的定义,塑料垃圾热点指的是在地表持续存在且面积大于等于2平方米,或沿河流渠道延伸长度大于等于5米的塑料堆积区域。

### 模型应用与性能评估

研究团队使用XGBoost和MP算法对收集到的347个塑料热点和非热点数据进行了分类处理。这些数据包括131个自然热点、115个人类活动热点和101个非热点。在模型训练和测试过程中,研究团队设计了多种实验方案,以评估不同参数组合对模型性能的影响。具体而言,实验分为七个类别:单独使用每个参数、使用每个参数组中的所有参数、使用其他八个参数、使用所有十二个参数组合。这些实验的目的是揭示参数对热点形成的相对影响,并确定最佳参数组合。

对于XGBoost模型,研究团队评估了五个关键指标:准确率(ACC)、灵敏度(SEN)、特异性(SPE)、正预测值(PPV)和负预测值(NPV)。在自然热点分类实验中,XGBoost模型在训练集上表现出较高的准确率,但测试集上的表现有所下降,随着模型应用于整个数据集,性能略有提升。在人类活动热点分类中,XGBoost模型同样在训练集上表现出色,但测试集上的准确率和特异性较低。然而,当所有热点被综合考虑时,XGBoost模型在测试集上的性能显著提升,且在某些指标上表现优于MP算法。

MP算法则采用了基于遗传编程的混合进化方法,通过结合全局搜索和局部优化,提高了模型的性能和适应性。MP算法在训练集上表现出较高的准确率,但在测试集上的表现有所下降。然而,当应用于整个数据集时,其性能再次提升。在自然热点分类实验中,MP算法的性能指标(如准确率、灵敏度、NPV和PPV)在测试集上略高于XGBoost模型,提升了1%至16%。对于人类活动热点,XGBoost模型在测试集上表现出更高的灵敏度,但MP算法在综合分类中显示出更强的泛化能力。

### 研究结果分析

研究结果表明,地形和水文因素对塑料热点的形成具有更显著的影响。在自然热点分类中,地形参数(如地形湿润指数、高程、坡度和距离到河流)表现出更强的预测能力,而水文参数(如径流累积、排水密度、日最大降雨量和平均风速)同样对热点形成有重要影响。相比之下,城市参数(如人口密度、土地利用、距离到道路和废弃物管理基础设施)在自然热点的预测中表现较弱,但在人类活动热点的分类中具有更强的关联性。例如,人口密度和废弃物管理基础设施与人类活动热点的形成密切相关,而土地利用类型则在一定程度上影响了垃圾的拦截能力。

在综合所有热点的情况下,地形和水文参数在预测性能上表现出更强的稳定性,而城市参数则显示出一定的局限性。这可能与研究区域的地形特征和城市结构有关,例如,地形的不规则性和水文的动态变化可能增加了垃圾迁移的可能性,而城市参数的有限空间和时间分辨率则可能影响模型的准确性。此外,研究团队发现,某些参数(如平均风速和日最大降雨量)在自然和人类活动热点的预测中均表现出较高的准确率,这表明这些参数对塑料垃圾的迁移和积累具有普遍性影响。

### 模型对比与应用意义

XGBoost和MP算法在本研究中均表现出较强的分类能力,但它们的工作原理和性能表现有所不同。XGBoost通过构建多个弱决策树来提高预测精度,但在测试集上容易出现过拟合现象,特别是在单独使用某些参数时。MP算法则通过结合全局搜索和局部优化,提高了模型的泛化能力和适应性,尤其在自然热点的分类中表现出更高的性能。然而,MP算法在处理某些城市参数时,如土地利用和距离到道路,显示出较低的特异性,这可能与研究区域的相对同质性有关。

本研究的结果对塑料污染的治理具有重要意义。首先,研究团队发现,地形和水文因素在塑料垃圾的迁移和积累中起着关键作用,这表明在制定治理策略时,应优先考虑这些因素的影响。例如,在地形陡峭或降雨频繁的区域,应加强垃圾拦截措施,如在排水系统中安装垃圾收集装置,以减少垃圾向河流和水体的扩散。其次,城市参数如人口密度和废弃物管理基础设施对人类活动热点的形成具有显著影响,这提示政策制定者应关注这些参数,以优化垃圾收集和处理系统,减少垃圾向自然环境的泄漏。

此外,研究团队还建议,未来的研究应结合物理模拟和机器学习方法,以更全面地理解塑料垃圾的迁移路径和行为。例如,通过实验室中的塑料运输模拟或使用GPS追踪器进行自然环境中的实验,可以进一步验证模型的预测能力,并为治理策略提供更具体的指导。同时,研究团队强调了数据质量和空间分辨率的重要性,特别是在处理城市参数时,由于数据的不完整性和时间滞后,可能导致模型的偏差和不准确。因此,未来的治理工作应注重数据的实时更新和多源数据的整合,以提高模型的适应性和准确性。

### 政策建议与未来研究方向

本研究的结果对政策制定和环境管理具有重要的指导意义。首先,研究团队建议,政府应加强对塑料污染的监管,特别是在生产、消费、废弃和循环利用等方面。此外,政策应鼓励采用更先进的回收技术,如自动化垃圾收集系统和生物降解技术,以提高塑料垃圾的回收效率。同时,应重视对废弃物管理基础设施的建设,特别是在人口密集和垃圾处理能力不足的地区,以减少塑料垃圾向自然环境的泄漏。

其次,研究团队指出,塑料污染治理应采取多层面的措施,包括治理层面、基础设施层面和社区层面。在治理层面,应制定严格的法规,限制塑料产品的使用和生产,推动环保设计和循环利用。在基础设施层面,应加强垃圾收集和处理系统的建设,特别是在河流和排水系统中安装垃圾拦截装置,以减少垃圾对水体的污染。在社区层面,应开展公众教育和意识提升活动,鼓励居民减少塑料使用和正确处理废弃物。

最后,研究团队建议未来的研究应进一步探索塑料垃圾的物理模拟和多因素影响。例如,结合水文模型和机器学习方法,可以更准确地预测塑料垃圾的迁移路径和潜在热点。此外,研究还应关注地下水和灌溉用水中微塑料的浓度,以评估塑料污染对人类健康的影响。通过这些综合措施,可以更有效地减少塑料垃圾对环境的破坏,并推动可持续的塑料管理政策的实施。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号