基于紫外-可见吸收与荧光光谱融合的机器学习模型预测二次供水系统中卤乙酸浓度

【字体: 时间:2025年06月22日 来源:Microchemical Journal 4.9

编辑推荐:

  针对二次供水系统(SWSSs)中高毒性卤乙酸(HAAs)传统检测方法耗时耗力的问题,研究人员创新性地结合紫外-可见(UV-Vis)吸收光谱和激发发射矩阵(EEM)荧光光谱技术,通过Savitzky-Golay(SG)、平行因子分析(PARAFAC)等预处理方法,构建了随机森林(RF)机器学习预测模型。该模型将输入变量从37-57个优化至3-14个,对MCAA、HAA5等6种HAAs的预测R2达0.640-0.933,为饮用水安全风险早期预警提供了实时监测新策略。

  

饮用水安全始终是公共卫生领域的核心议题。在高层建筑林立的现代都市,二次供水系统(SWSSs)作为连接市政管网与终端用户的"最后一公里",其水质安全直接影响数亿人的健康。其中,卤乙酸(HAAs)作为氯消毒过程中产生的第二大消毒副产物(DBPs)群体,因其强致癌性和遗传毒性备受关注。令人担忧的是,研究表明SWSSs中的HAAs浓度普遍高于市政管网,这主要源于水箱滞留导致的持续氯化反应。传统的气相色谱(GC)检测方法虽精确,但单样本需3-4小时前处理,且涉及有毒试剂,难以满足大规模快速监测需求。

针对这一技术瓶颈,深圳市科技创新委员会资助的研究团队在《Microchemical Journal》发表创新成果。该研究首次将紫外-可见吸收光谱(UV-Vis)与三维荧光光谱(EEM)技术联用,结合机器学习算法,建立了SWSSs中HAAs浓度的实时预测体系。研究人员历时一年采集中国南方城市117份季节性样本,通过Savitzky-Golay平滑(SG)、乘性散射校正(MSC)等光谱预处理方法消除干扰,采用竞争性自适应重加权采样(CARS)和荧光特征指数(FSIs)进行特征筛选,最终构建了包含多元线性回归(MLR)、支持向量机(SVM)和随机森林(RF)等算法的预测模型体系。

光谱预处理与特征选择
原始UV-Vis光谱在200-250nm区间呈现明显吸收峰,经二阶导数(D2)处理后有效消除了基线漂移。EEM数据通过PARAFAC分解出3个荧光组分,其中类腐殖酸组分与TCAA浓度显著相关。对比发现,SG平滑对UV-Vis光谱的噪声抑制效果最佳,而FSIs方法提取的荧光峰强度比值(BIX、HIX)对HAA9预测贡献突出。

模型性能比较
在五类机器学习模型中,RF模型展现出最优的预测稳定性,其对DCAA和TCAA的预测R2分别达到0.693和0.640。引人注目的是,当融合水质参数与光谱特征时,模型性能显著提升——MBAA的预测R2从0.621跃升至0.783。SHAP分析揭示UVA254和荧光组分C2是影响HAAs预测的最关键变量。

模型简化与解释
通过SHAP值排序实现了输入变量的智能精简:MCAA的预测变量从37个锐减至10个,而TCAA仅需3个核心变量即可维持0.640的预测精度。这种降维不仅提升计算效率,更凸显了254nm处紫外吸收与275nm/340nm荧光峰对HAAs的特异性响应。

该研究突破了传统检测的技术壁垒,将单样本分析时间压缩至10分钟内,且无需化学前处理。通过多光谱融合策略,有效克服了UV-Vis受悬浮物干扰、EEM存在内滤效应等局限性。特别值得关注的是,模型对含溴HAAs(MBAA)的优异预测性能(R2=0.783),解决了传统方法对Br-依赖的监测难题。这项成果为智慧水务建设提供了可落地的技术方案,通过部署在线光谱探头,有望实现SWSSs中HAAs风险的动态预警,对保障饮用水安全具有重要实践价值。未来研究可进一步探索深度学习算法与拉曼光谱的融合,以提升复杂水质条件下的预测鲁棒性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号