《Water Research》:Chemical profiling of industry wastewaters to identify industry sources of contaminants
编辑推荐:
污水处理厂日益成为多种工业排放物的汇合点。针对那些难以在污水处理过程中降解的化学物质,通过出水排放和/或生物固体再利用,它们成为潜在的污染源。要管理这些化学物质,控制和限制其进入下水道是关键,但具体来源尚不清楚。本研究旨在对排入下水道的工业废水化学物质进行特征分析,并识别特征性的行业标志物。研究人员构建了迄今最大的工业废水数据集,涵盖20个工业领域的132份样本,量化了117种分析物(包括88种新兴污染物)。研究揭示了行业特异性特征,并开发了随机森林方法以支持基于污染物的溯源。研究结果凸显了扩大工业废水采样范围以加强溯源和支撑针对性污染控制的实际应用的必要性。
随着城市化和工业化进程不断推进,我们日常生活中产生和排入下水道的污水成分变得日益复杂。这不仅包括了来自千家万户的生活污水,更汇聚了来自各类工厂、企业的工业废水。污水处理厂(Wastewater Treatment Plant, WWTP)作为城市水循环的关键节点,其设计初衷主要是去除常规污染物,如有机物、悬浮固体和病原体等,以满足排放标准。然而,如今的污水处理厂正日益成为一个巨大的化学物质“收集器”,接收着来自五花八门工业活动排出的、成分复杂且往往高浓度的废水。一个严峻的问题是,许多新兴的化学污染物,例如药品与个人护理用品(PPCPs)、农药以及被称为“永久化学品”的全氟及多氟烷基物质(PFAS),在传统的污水处理工艺中难以被有效降解或去除。这意味着,这些物质要么随处理厂的出水进入河流湖泊等自然环境,要么富集在污水处理过程中产生的污泥(生物固体)中,当这些污泥被用于土地改良或肥料时,化学物质又可能重新进入食物链或地下水系统,最终对生态系统和人类健康构成潜在风险。
要解决这一难题,最根本的途径是在污染物进入下水道网络之前就进行控制,即“源头控制”。但这面临一个关键瓶颈:当一个污水处理厂的进水或出水中检测到某种异常高浓度的化学物质时,我们往往很难快速、准确地判断它究竟来自哪个或哪类工厂。现有的监管主要依赖对常规水质参数(如化学需氧量COD、生化需氧量BOD5、总氮总磷等)的监测,但这些参数在多个行业都存在,重叠度高,如同“大众脸谱”,缺乏特异性,无法精准指向具体行业。因此,描绘不同行业的“化学指纹”,识别出能够作为“身份标签”的特征性化学标志物,对于实现精准溯源和高效管理至关重要。
由昆士兰大学环境健康科学联盟(QAEHS)的Chantal A. Keane等人领导的研究团队,在《Water Research》上发表了一项开创性的研究。他们系统性地对工业废水进行了大规模的化学特征分析,旨在填补这一知识空白。研究团队在澳大利亚东南昆士兰的9个污水处理厂汇水区内,对132家不同行业的企业进行了废水采样,这些企业覆盖了食品制造、饮料、化工、金属加工、废物处理、洗衣服务等20个主要工业门类。研究人员不仅测定了29项常规水质参数,还利用先进的分析技术(如高效液相色谱-串联质谱法 HPLC-MS/MS),针对性地检测了30种药品(包括安赛蜜和咖啡因)、33种农药和25种PFAS,共计88种新兴污染物。
为了从海量的化学数据中提炼出能够区分不同行业的“指纹”,研究人员开发了一套基于随机森林(Random Forest, RF)算法的机器学习工作流程。随机森林是一种强大的分类模型,它能够处理复杂的非线性关系,并识别出哪些化学物质或参数组合对区分特定行业最具判别力。通过这一方法,研究不仅能够筛选出每个行业的“十佳”单一标志物及其判别阈值(例如“安赛蜜浓度≥247 μg/L可指向饮料行业”),还能评估模型对整个废水样本进行行业溯源的预测能力。
那么,不同类型的工厂排放的废水,究竟有哪些独特的“化学签名”呢?研究发现,不同行业的废水呈现出鲜明且多样化的污染特征。
3.1. 总体污染物特征
在所检测的分析物中,多种化学物质在工业废水中被广泛检出,浓度横跨数个数量级。药品浓度最高可达640±1700 μg/L(安赛蜜),农药浓度高达99±190 μg/L(2,4-D),PFAS浓度最高达10±14 μg/L(全氟癸酸 PFDA)。常规水质参数如化学需氧量(COD)、总溶解盐(TDS)、生化需氧量(BOD5)和悬浮固体(SS)的平均浓度也远高于生活污水基线水平。
3.2. 行业特征性标志物与生活源标志物的区分
研究的一个重要贡献是区分了真正源自工业过程的“特征性标志物”和可能因管道错接等原因混入的“生活源标志物”。生活源标志物(如咖啡因、避蚊胺DEET、对乙酰氨基酚等)在许多行业废水中高频、广泛出现,反映了人类活动的普遍影响。相比之下,特征性行业标志物则表现出独特的行业专属性或极高的浓度。例如:
- •
废物处理行业:检出最多种类的农药和PFAS,多种农药(如莠灭净、西维因)和PFAS(如全氟戊烷磺酸 PFPeS)仅在该行业发现。
- •
化工行业:羟考酮和8:2氟调聚物磺酸盐(8:2 FTS)为其独有标志物。
- •
饮料行业:安赛蜜和咖啡因的浓度在所有行业中最高,远超基线。
- •
初级金属行业:全氟庚烷磺酸(PFHpS)为其独有标志物,全氟辛烷磺酸(PFOS)浓度最高。
- •
洗衣行业:氯胺酮和N-甲基全氟辛烷磺酰胺乙醇(N-MeFOSE)为其独有标志物。
3.3. 特定行业的化学特征谱
研究进一步通过热图等形式,详细描绘了各行业的化学特征谱:
- •
废物处理行业:污染物谱最广,浓度最高,是多种农药和PFAS的主要来源,例如一个危险废物处理设施释放了最高浓度的2,4-D。
- •
化工行业:废水以高浓度的钠、硼和总溶解盐为特征,并释放了最高浓度的多种药品(如卡马西平、萘普生)。
- •
食品行业:作为采样数量最多的行业,其废水以极高的营养盐(总磷、总氮)、油脂及有机负荷为特征。
- •
饮料行业:除了特征性的安赛蜜和咖啡因,其废水的BOD5和悬浮固体浓度也极高。
- •
初级金属行业:废水中钙、镁、锌的浓度极高,PFAS谱以PFHpS和PFOS为特征。
- •
金属相关行业:矿物行业硼和钼浓度最高;金属制品行业硫和铬浓度极高;珠宝加工业是唯一检出银的行业。
- •
洗衣行业:废水含有独特的氯胺酮和N-MeFOSE,并具有最高的利多卡因和双氯芬酸浓度。
- •
其他行业:如造纸业(对乙酰氨基酚浓度最高)、车辆维护业(敌草隆和铜浓度最高)、电池制造业(唯一检出铅)、水处理业(铝浓度最高)等,也都有各自可辨别的化学信号。
3.4. 判别性特征与跨行业类别的决策规则
随机森林模型成功提取了用于区分各行业的简洁、可解释的决策规则。这些规则通常是“高X且低Y”的组合形式,更能捕捉工艺特异性对比。例如:
- •
饮料业:安赛蜜 ≥ 247 μg/L,咖啡因 ≥ 627 μg/L。
- •
食品业:钾 ≥ 101 mg/L,镁 ≥ 9.9 mg/L。
- •
洗衣业:双氯芬酸 ≥ 0.26 μg/L,且总氮 ≤ 16 mg/L。
- •
初级金属业:锌 ≥ 2.2 mg/L,总氮 ≥ 463 mg/L,且总悬浮固体 ≤ 130 mg/L。
3.5. 行业预测性能与污染物驱动因素
在测试集上,模型对50%(12/24)的样本做出了正确的行业分类,对样本量充足的行业(如食品业)预测性能较好。分类错误的案例多发生在化学特征谱重叠的行业之间(如饮料与食品、洗衣与食品)。通过沙普利加和解释(SHAP)等模型可解释性工具分析发现,错误分类通常是由于样本中行业特异性标志物表达不充分,或者跨行业共有的分析物(如常规有机负荷参数)的浓度掩盖了微弱的真实类别信号。
结论与讨论
这项研究是首次基于行业类型对工业废水进行系统性收集和化学特征分析的大规模研究。它成功揭示了不同工业废水化学特征的多样性及其作为污染溯源“指纹”的潜力。研究识别了废物处理、化工、食品、饮料及金属相关行业的独特污染物谱,其中一些物质仅在特定行业检出或浓度超过基线数个数量级。通过将工业废水化学指纹与随机森林建模相结合,研究提供了可解释的决策规则和具有一定准确性的分类工具,为监管部门和污水处理企业识别和管理工业污染源提供了实用的方法框架。
尽管研究存在一些局限,如样本在不同行业间分布不均衡、未能覆盖所有潜在工业化学品、以及模型对某些样本量少的行业分类能力有限等,但它成功验证了基于化学组成数据进行工业污染溯源的可行性。这项研究建立了一个可扩展的框架。未来,通过纳入更广泛、更具代表性的行业样本,并结合非靶向筛查等技术发现更多特异性标志物,将能进一步提升预测的准确性和普适性。最终,这项成果将有助于实现更精准的源头控制,减轻污水处理厂的污染物负荷,推动可持续的废水管理,为保护水环境和公众健康提供有力的科学工具。
在技术方法层面,本研究主要依靠几个关键技术环节支撑:首先,站点选择与分类基于澳大利亚和新西兰标准行业分类(ANZSIC)系统,在9个污水处理厂汇水区内对132家不同行业企业进行采样。其次,废水与化学分析涵盖了29项常规参数和88种新兴污染物(药品、PFAS、农药),其中痕量化合物的分析采用了经过改良的QuEChERS方法结合固相萃取(SPE)进行前处理,并使用高效液相色谱-串联质谱(HPLC-MS/MS)分别在正/负离子模式下进行定性与定量。最后,数据驱动的随机森林建模与统计分析构成了研究的核心,包括数据预处理、模型训练与超参数调优、基于约登指数(Youden‘s J)的特征筛选以获取单标志物决策规则,并使用混淆矩阵、接收者操作特征曲线(ROC)及沙普利值(SHAP)等方法对模型性能进行评估和解释。