编辑推荐:
为解决 CARS 算法提取特征波数点(FWP)易漏透射峰(TP)、计算负荷高且 ANN 模型精度低的问题,研究人员开展基于红外光谱和 ANN 的 MPs 识别研究,提出 EIS-VIP-CARS 法。结果表明该法提取 FWP 少、模型精度超 99%,为 MPs 研究及废塑料管理提供参考。
微塑料(MPs)作为全球关注的新兴污染物,像无形杀手般悄然扩散至海洋、土壤甚至人体。这类直径 1 微米至 5 毫米的塑料颗粒,经光照、氧化等作用从大块塑料分解而来,不仅会释放持久性有机污染物(POPs)等有毒物质,还可能引发氧化应激、代谢紊乱等健康风险,被视为 21 世纪最严峻的环境挑战之一。然而,精准识别微塑料的 “身份” 并非易事:传统视觉分选误差高达 70%,拉曼光谱易受荧光干扰,傅里叶变换红外光谱(FTIR)虽被广泛应用,却依赖人工比对光谱,耗时且易受主观影响。随着机器学习(ML)的兴起,如何将其与光谱技术结合,高效提取特征光谱、提升识别精度,成为破解微塑料环境行为研究瓶颈的关键。
为攻克这一难题,国内研究团队开展了系列创新研究。他们聚焦 20 种典型微塑料,针对传统竞争自适应重加权采样算法(CARS)提取特征波数点(FWP)时易遗漏透射峰(TP)、计算负荷高的缺陷,提出一种融合等间隔采样(EIS)和投影变量重要性(VIP)的新型特征提取方法 ——EIS-VIP-CARS,并构建人工神经网络(ANN)模型评估识别性能。这项研究成果发表在《Environmental Research》,为微塑料的精准检测开辟了新路径。
研究主要采用以下关键技术方法:首先利用 FTIR 获取微塑料的中红外光谱,随后通过 EIS 对全光谱进行降维,保留主要信息;接着将 VIP 引入 CARS 算法,替代传统的回归系数绝对值(AVRC)作为权重评估标准,构建 EIS-VIP-CARS 模型提取特征光谱;最后对比分析基于全光谱、EIS、CARS、EIS-CARS、VIP-CARS 及 EIS-VIP-CARS 的 ANN 模型性能,同时考察多层神经网络(MNN)、卷积神经网络(CNN)与浅层神经网络(SNN)的差异。
全光谱分析与特征提取性能对比
研究显示,微塑料样本的中红外光谱在 3100-2850 cm-1范围内普遍存在多个独立且共有的功能基团(FGs),其中 3100-3000 cm-1对应芳香族和不饱和烃的 = C-H 键伸缩振动,2990-2850 cm-1与脂肪族化合物的 - CH3和 - CH2- 基团伸缩振动相关。通过不同算法提取特征光谱时,VIP-CARS 较 CARS 减少 49.41% 的 FWP,且分布更集中于透射峰附近,基于其构建的 ANN 模型识别精度普遍高于 CARS;而 EIS-VIP-CARS 进一步将 FWP 数量降至 55 个,较 EIS 和 VIP-CARS 分别减少 58.65% 和 57.03%,且特征点分布与功能基团高度吻合。
人工神经网络模型性能评估
在模型对比实验中,基于 EIS-VIP-CARS 的 ANN 模型对微塑料的识别准确率与 EIS 模型相近,均超过 99%,展现出良好的泛化能力。同时发现,MNN 和 CNN 模型的精度高于 SNN,但建模时间更长。这表明,尽管深层神经网络在复杂特征学习中具有优势,EIS-VIP-CARS 与 ANN 的结合已能在保证高精度的前提下显著提升计算效率。
结论与意义
本研究通过优化特征提取算法与机器学习模型,成功建立了一种高效精准的微塑料红外光谱识别方法。EIS-VIP-CARS 算法通过整合等间隔采样的全局信息保留能力和 VIP 的变量重要性评估机制,解决了传统 CARS 算法在特征提取中易遗漏关键透射峰、计算冗余的问题,使特征波数点数量大幅减少的同时,模型识别准确率保持在 99% 以上。这一成果不仅为微塑料的环境行为研究提供了关键技术支撑,也为塑料废弃物的分类管理奠定了方法学基础,有望推动全球在微塑料污染监测与防控领域的技术革新。未来,若能进一步拓展至更多类型的微塑料及复杂环境样本,该方法或将在生态风险评估与公共卫生领域发挥更大价值。