综述:机器学习在微塑料定量分析中的应用:技术、挑战与未来方向

【字体: 时间:2025年10月28日 来源:Cleaner Water

编辑推荐:

  这篇综述系统阐述了机器学习(ML)和计算机视觉(CV)技术在微塑料(尤其是来自合成纺织品的微纤维)检测、定量与分析中的前沿应用。文章批判性地评估了传统方法(如FTIR、Raman光谱)的局限性(如耗时、主观性强),并重点介绍了多种ML算法(如SVM、PCA、CNN、kNN、RDF、ANN等)如何实现自动化、高通量且精准的微塑料识别与分类。同时,综述深入探讨了当前面临的挑战(如传感器限制、纺织品功能化影响、数据共享壁垒)并展望了未来方向(如数字产品护照DPP、标准化数据库、跨供应链数据整合),为推动环境监测与纺织行业可持续发展的协同创新提供了重要见解。

  

引言

纺织品是人类生活的重要组成部分,提供抵御不同环境条件的保护。合成纤维已被合成用于各种应用,包括服装和技术纺织品。微塑料污染问题已引起全球关注。微塑料污染已成为一个广泛的全球性环境问题,其普遍性记录在海洋、淡水、陆地和空气环境中。总的来说,在各种生态系统中检测到的、由合成材料降解产生的微小塑料颗粒构成了严重的生态和生物风险。主要来源包括合成织物、包装废物、轮胎磨损和工业排放。从北太平洋副热带环流、工业化区域的河流系统到塑料使用密集的沿海地区,甚至在极地地区和深海沉积物中都发现了微塑料,表明其广泛传播。它们的持久性和生物可利用性带来了生态危害,例如水生生物摄入、营养级转移和潜在毒性。尽管意识日益增强,但一致的监测技术和全球数据集仍然不足,凸显了跨多个区域和部门统一评估框架和缓解解决方案的迫切必要性。
监测微塑料污染对于了解其起源及其对生态系统和人类健康的影响至关重要。然而,由于这些微小颗粒在废水中的含量很低,收集它们是一项艰巨的任务。目前没有普遍适用的微塑料分析方法,光学识别方法是主流方法。传统技术,包括视觉评估、FTIR、显微镜和拉曼光谱,虽然有效,但受到劳动密集型过程、操作员偏见和低效率的限制。

现有微塑料定量技术

微塑料的定量评估对于理解环境污染至关重要。环境样品中微塑料的数量通过两个指标测量:数量浓度和质量浓度。数量浓度是将手动计数转化为浓度测量的过程,采用视觉检查和光谱学等技术。质量浓度是比数量浓度更可靠的测量方法,因为它能准确测量环境负荷并揭示微塑料的来源。热分析是一种广泛使用的质量浓度定量技术。
目前,环境中微塑料定量的主要方法包括视觉检查、密度分离、浮选、尺寸分离、消化程序、生物消除和摄取、化学处理以及其他类似方法。物理表征检查可以提供关于微塑料粒径、颜色、形状、形态、初步分类、腐蚀程度和老化程度的初始信息。
图像分析 是微塑料研究中常用的一种快速评估尺寸、形状和形态及丰度的技术。该程序首先提供图像尺寸的物理测量。对于纤维,可以通过使用直线或分段线来确定纤维沿其纵轴的全长。如果条件不满足,可以使用骨架化功能处理阈值图像,将纤维缩减为其中心线,便于长度计算。
视觉分析 是量化家庭洗涤产生的微塑料的常用技术。然而,该技术允许基于颜色、形状和尺寸对微塑料进行基本分类和量化。视觉分析方法具有操作简单、成本低和使用过程中化学风险较小的优点。但视觉分析有三个固有的限制:首先,它无法提供微塑料化学成分的信息;其次,该方法容易受到人为因素和测量误差的影响;最后,该方法不是连续进行的,数据没有数字化,难以与生产链共享数据,且耗时耗力。
化学表征方法,如扫描电子显微镜-能量色散X射线分析(SEM-EDX)、傅里叶变换红外光谱(FTIR)、拉曼光谱、热分析和质谱法,可用于分析微塑料的化学成分。这些技术可以确定微塑料中存在的功能基团、分子量、结构和聚合度。
FTIR 是一种振动光谱技术,可以提供材料中化学键和功能基团的数据。FTIR通过将微塑料与光谱库中已建立的聚合物参考光谱进行比较来确定其化学成分。其主要模式有镜面反射、透射和衰减全反射。FTIR光谱具有非侵入性、预处理简单和高效高通量筛选的优点。然而,其10-20μm的空间分辨率限制了其检测小于20μm微塑料的能力。
拉曼光谱 由分子化学键极化率的变化产生,是包括微塑料在内的聚合物材料的独特标识符。拉曼光谱提供宽范围的波长、降低的信噪比以及与FTIR光谱相比更短的光谱带。该系统能够检测粒径小于20μm和500nm的微塑料。然而,拉曼测量显示无法识别荧光和有色纺织纤维材料,存在与聚合物光谱重叠的可能性,以及聚合物光降解或热分解的可能性。
其他先进技术,如数字全息术,通过光学干涉和深度学习获取透明或半透明微塑料的三维数据,为复杂环境基质中微塑料和微纤维的识别和分析提供了一种强大的非侵入性方法。热分析(如DSC、TGA)和质谱法(如Pyr-GC/MS)也用于微塑料的鉴定和定量,但可能具有破坏性或在区分某些聚合物方面存在困难。流式细胞术提供了一种基于粒子散射光分析的计算机化方法,适用于高通量颗粒计数,但可能在化学特异性方面存在局限。

用于微塑料定量的机器学习技术

机器学习(ML)是人工智能(AI)的一个重要组成部分,可实现快速数据分析、特征提取以及自动分类或预测。在微塑料研究中,ML在与高光谱成像结合时,已在检测和预测污染水平、测量其毒性和评估吸附能力方面显示出效率。
ML算法可分为无监督学习有监督学习。无监督学习不依赖标记数据,旨在发现数据中的内在结构。常用的方法包括:
  • K均值聚类:一种迭代分区方法,将数据划分为k个不同的簇。其有效性受k值选择的影响很大。
  • 层次聚类分析(HCA):构建簇的层次结构,从每个数据点自成一簇开始,到最后合并为一个簇。
  • 主成分分析(PCA):一种广泛使用的降维技术,用于分析拉曼光谱以识别粒子、材料或细胞。它有助于通过解释微塑料的拉曼光谱矩阵来区分潜在微塑料与背景光谱。
  • 均匀流形近似与投影(UMAP):一种有效的降维方法,旨在在低维表示中保持高维数据的局部和全局结构。
有监督学习需要标记的输入-输出对来训练模型,在分类任务中非常有效。常用技术包括:
  • 软独立建模类类比(SIMCA):使用PCA分别对每个类别进行建模的有监督分类方法。
  • K最近邻(kNN):一种简单直观的算法,根据未知样本的k个最近邻中的主要类别为其分配标签。
  • 偏最小二乘判别分析(PLS-DA):PLS的有监督扩展,通常用于分类任务,将类别成员信息集成到回归模型中。
  • 支持向量机(SVM):强大的有监督学习算法,通过在高维特征空间中识别最优超平面来分离类别,并最大化边界。
  • 决策树(DT)和随机决策森林(RDF):DT使用基于输入特征的树状决策模型来预测目标变量的值。RDF是一种集成学习技术,构建多个决策树并使用随机子集的数据和特征,通过聚合所有单个树的结果(多数投票)进行最终预测。
  • 人工神经网络(ANN)和深度学习:ANN受生物神经系统启发,由相互连接的神经元组成。卷积神经网络(CNN)是专为图像分析设计的ANN,通过处理像素块来提高分类效率。深度学习模型,特别是深度CNN,在图像和光谱特征提取方面表现出色,在微塑料识别和分类方面显示出巨大潜力。
这些ML技术在与高分辨率成像和标准化数据集结合时,可以显著推进微塑料研究和环境监测。

挑战与未来方向

将ML和MV技术应用于微塑料定量分析面临几个挑战:
相机及其灵敏度:在家庭洗涤过程中释放的微塑料的图像采集通常在变化的条件(如洗涤剂类型、水质、浊度、泡沫水平)下进行。最佳检测性能取决于根据成像环境校准相机参数(如分辨率、像素大小、帧率)。环境条件,包括温度、传感器噪声、环境光、对焦和稳定性,都会影响图像质量。
纺织品功能化的影响:纺织品的功能化,包括着色和整理过程,在决定微塑料的视觉和光谱特性方面起着关键作用,从而影响其可检测性和图像采集与处理过程中的准确分类。使用不同类型的染料(如活性染料、酸性染料、分散染料、还原染料)和整理剂(如阻燃剂、防水剂、抗皱剂、纳米颗粒基整理剂、光/热致变色化合物)会显著改变纤维的外观和光学特性,给自动图像处理任务带来挑战。
参考库和匹配软件:参考库对于快速准确地识别纺织品中的微塑料至关重要,特别是通过光谱和形态表征。现有的商业光谱库(如NIST、KnowItAll)在用于纺织品衍生的微塑料时存在局限性,例如聚合物多样性有限、光谱分辨率不一致以及缺乏与纺织品相关的条目(如染色或整理过的纤维)。虽然已经开发了一些用于微塑料分析的软件工具(如siMPle、MPAPP、Open Specy、POSEIDON),但大多数是针对宏观和微观塑料颗粒优化的,并非专为纺织纤维基微塑料设计。
数据共享与存储:在纺织价值链的所有阶段透明共享量化的微纤维释放数据对于解决微纤维污染至关重要。透明的数据共享可以增强性能优化,促进可持续生产过程,并有助于遵守环境法规。随着微纤维监测日益受到重视,特别是基于机器学习的图像分析和分类系统,对标准化、集中化数据仓库的需求变得更加明显。
未来方向:未来的研究应优先开发一个闭环数字框架,用于在整个纺织品生产生命周期中进行监测和反馈集成。建立普遍标准化的排放量化协议和数据互操作性对于确保透明度、问责制和跨部门协作至关重要。将机器学习算法和基于区块链的可追溯工具集成可以增强数据完整性,减少人为错误,并实现各种使用和洗涤条件下微纤维脱落的预测建模。跨学科合作、对高分辨率成像的投资、开源注释数据集和标准化图像采集协议对于充分利用ML和MV在可持续环境监测和纺织品生命周期管理中的潜力至关重要。

结论

机器学习(ML)和机器视觉(MV)在微塑料识别、分类和分析中的整合为环境监测带来了重大进步。无监督学习技术(如K均值、层次聚类、PCA)能有效揭示未标记数据中的潜在模式,实现初始分割和分类。有监督模型(如SVM、KNN、决策树、CNN、ANN和深度学习)在基于注释数据集训练时,在聚合物分类、形状识别和降解预测方面表现出高精度。尽管这些技术在提高分析速度、精度和自动化方面前景广阔,但仍面临显著限制,包括成像约束(如低分辨率、照明不一致、校准不良、放大倍率可变)损害模型可靠性;缺乏标准化、高质量的参考数据集/库阻碍了再现性和交叉验证;以及由于专有格式、基础设施差距和知识产权导致的数据共享受限,阻碍了行业内的协作进展。
鉴于ML的数据驱动特性,开发通用、开放访问的数据库至关重要。目前的微塑料库在数量
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号