基于数据驱动和机器学习的包气带砷衰减因子(AF)现场特异性评估框架及其在韩国21个场地的应用验证

《Environmental Science & Technology》:Data-Driven Framework for Determining Site-Specific Attenuation Factors of Arsenic in the Vadose Zone

【字体: 时间:2026年01月15日 来源:Environmental Science & Technology 11.3

编辑推荐:

  本文推荐一种创新框架,将机器学习(ML)随机森林(RF)回归模型与溶质运移的动水-不动水(MIM)模型相结合,用于确定包气带中砷(As)的现场特异性衰减因子(AF)。该框架利用易获取的包气带属性(如土壤质地、容重(ρb)、有机质(OM)和铁(Fe)含量)预测MIM模型关键参数(θ, θm/θ, ω, λ, Rm, Rim)及砷的再活化潜力(RMP),进而模拟砷在考虑干湿循环诱发再活化情况下的迁移。应用于韩国21个场地的结果表明,AF值(3.56–24.38)均大于美国环保署(USEPA)默认值1,凸显了包气带的缓冲能力及现场特异性评估的必要性,为砷的地下水污染风险可靠评估提供了实用工具。

  
1. 引言
地下水砷(As)污染对公众健康构成严重威胁。包气带在控制砷迁移中起着关键作用,然而当前美国环保署(USEPA)的土壤筛选水平(SSL)指南在计算与地下水相关的暴露时,对于包气带条件下的衰减因子(AF)保守地设定默认值为1(即无衰减)。砷在包气带中的迁移受不饱和流条件下复杂生物地球化学过程的控制,其预测面临挑战。动水-不动水(MIM)模型虽然能模拟不饱和条件下的溶质运移,但其所需的众多现场和化学特异性参数往往难以获取。
2. 材料与方法
本研究旨在开发一个数据驱动框架,用于确定包气带中砷的现场特异性AF值。该框架整合了机器学习(ML)回归模型与MIM溶质运移模型。
2.1. 动水-不动水模型
MIM模型假设孔隙水分为动水区(θm)和不动水区(θim),溶质通过平流和弥散在动水区迁移,并通过浓度梯度驱动的扩散在两区之间进行质量交换。砷在土壤颗粒上的吸附分别用动水区和不动水区的阻滞因子Rm和Rim表示。模型的控制方程包括总含水量θ = θm+ θim,以及描述动水区和不动水区浓度(Cm, Cim)变化的偏微分方程组。水动力弥散系数Dm由机械弥散(λvm)和分子扩散(Doτ/θ)构成,其中τ(曲折因子)通过τ = θ7/3s2计算,θs(饱和含水量)假定等于总孔隙度(1 - ρb/2.65)。动水区渗流速度vm= q/θm,其中q为水通量。
2.2. 建模参数收集
研究从已发表的9篇文献中收集了129个数据点,这些数据通过反拟合不饱和土柱实验的穿透曲线(BTCs)获得了MIM模型的运移参数(θ, θm/θ, ω, λ)。此外,还利用了作者前期研究中通过土柱实验获得的砷在动水区和不动水区的阻滞因子(Rm, Rim)以及表征干湿循环下砷再活化潜力的参数(RMP)。RMP定义为再活化砷的最高浓度(Cremobilized)与土壤中剩余砷浓度(Csoil)之比。
2.3. 运移和归宿参数的回归模型
2.3.1. 运移参数
采用随机森林(RF)回归方法,基于包气带属性(砂粒、黏粒、粉粒含量、容重ρb、水通量q)预测MIM运移参数(θ, θm/θ, ω, λ)。数据处理包括使用四分位距(IQR)法剔除异常值,并使用MinMaxScaler进行特征归一化。通过网格搜索交叉验证优化RF模型的超参数(树的数量、最大深度、最小分裂样本数)。模型性能使用留一法交叉验证(LOOCV)进行评估,以决定系数(R2)和均方根误差(RMSE)作为指标。所有RF模型对运移参数的预测均表现出良好的拟合优度(R2> 0.9)和较低的RMSE值。
2.3.2. 砷特异性归宿参数
基于前期实验数据,建立了通过土壤属性(Fe含量[Fe]、OM含量[OM]、均匀系数Cu、小于其占比30%的颗粒粒径D30、容重ρb)预测Rm和Rim的经验方程。同样,使用RF回归模型预测了RMP,其R2值为0.95,RMSE为0.02。
2.4. 韩国各地的包气带属性
为评估框架的适用性,从韩国土壤信息系统和地下水综合信息服务等公共来源获取了韩国21个场地的包气带属性(土壤质地、ρb、OM含量、包气带深度等)。Fe含量通过现场研究获取。计算了Cu和D30。若属性在多个深度获得,则使用深度加权平均值作为代表值。
3. 结果与讨论
3.1. RF模型对运移和归宿参数的性能
RF回归模型对所有MIM运移参数的预测均表现出高精度(R2> 0.9),LOOCV验证的RMSE值较低,表明模型具有稳健性和泛化能力。RF模型同样成功预测了RMP。尽管训练数据集偏向砂质土壤,但只要输入土壤属性在数据范围内,预测结果被认为是有效的。
3.2. 确定包气带砷现场特异性AF的框架开发
该框架模拟了在稳态不饱和流和干湿循环条件下砷在包气带中的迁移。假设地表15 cm厚土层受到砷污染(初始浓度Cinitial= 25 mg/kg,符合韩国标准)。通过分布系数Kd计算孔隙水初始浓度Cpw。总体阻滞因子R由Rm和Rim加权平均得到,并关联到Kd。入渗率设定为韩国年平均降雨量1400 mm/年。使用CXTFIT软件运行MIM模型,预测由阻滞控制的迁移释放到地下水中的砷浓度(Cgw_infiltration)。随后,考虑干湿循环引起的再活化,计算再活化释放的砷浓度(Cgw_remobilization)。Csoil通过初始砷质量减去已迁移至地下水的砷质量得到。总地下水砷浓度Cgw_total(t + Δt)为Cgw_infiltration(t + Δt)与Cgw_remobilization(t)之和,其中时滞Δt = Lθm/q。AF定义为Cpw与最大Cgw_total(Cgw_total(max))的比值。
3.3. 框架的实际应用
将框架应用于韩国21个场地。首先利用场地特异性包气带属性,通过RF模型预测MIM运移参数和砷归宿参数。然后使用MIM模型模拟砷迁移。结果表明,所有21个场地的AF值均大于1(范围3.56至24.38),表明包气带对砷具有明显的衰减能力,否定了USEPA默认AF=1的保守假设。AF值在不同场地间差异显著(最高值约为最低值的6.8倍),强调了现场特异性评估的重要性。再活化对Cgw_total的贡献是显著的,在Gimje-si场地最高贡献达21.8%。配对t检验证实再活化的贡献具有统计学意义。
4. 环境意义
本研究开发的框架将MIM模型与基于机器学习的参数预测相结合,为确定包气带砷的现场特异性AF提供了一种实用方法。框架利用易获取的土壤属性,避免了复杂耗时的参数测量。应用结果表明,忽略包气带的自然衰减能力会高估地下水污染风险。建议的风险评估工作流程包括:收集场地属性、预测MIM参数、模拟砷迁移计算AF、进而评估风险或反推保护地下水的表层土壤最大允许浓度。
5. 局限性及未来工作
框架的局限性包括对均质土壤剖面、均匀含水量和稳定入渗等简化假设,实际包气带的非均质性、湿度梯度、氧化还原波动等可能影响预测结果。模型尚未进行外部验证,未来工作需要利用独立的现场或实验数据进行验证,并量化预测不确定性,以增强其在监管决策中的适用性。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号