基于多层感知机(MLP)的高通量微塑料FTIR光谱分类:机器学习加速环境污染物分析的新策略

【字体: 时间:2025年09月21日 来源:Microchemical Journal 5.1

编辑推荐:

  本研究针对传统FTIR光谱库匹配方法在微塑料分析中计算效率低、依赖人工验证的瓶颈,开发了一种基于多层感知机(MLP)的半自动分类工作流。通过吸收度转换和基线校正预处理,系统实现了对10种欧盟优先聚合物等13类材料的高精度分类(准确率99.96%),将分析时间从数小时缩短至10-30分钟,为环境微塑料的高通量筛查提供了可靠解决方案。

  

随着塑料污染在全球生态系统中的日益加剧,微塑料(MPs)已成为威胁环境和人类健康的重要污染物。这些尺寸小于5毫米的塑料颗粒广泛分布于水体、土壤和大气中,其准确识别与定量分析对评估污染程度和生态风险至关重要。傅里叶变换红外(FTIR)成像技术凭借其高空间分辨率和化学特异性,成为微塑料表征的主流手段。然而,传统的谱库相关性分析方法面临重大挑战:不仅计算耗时长达数小时,还需大量人工验证,对复杂环境样本中存在的噪声、基线漂移和基质干扰尤为敏感,严重制约了大尺度研究的效率。

为突破这些技术瓶颈,因斯布鲁克大学的Jovan Badzoka团队在《Microchemical Journal》上发表了一项创新研究,提出将机器学习中的多层感知机(MLP)模型应用于高光谱FTIR数据的分类工作流。该研究通过溴化钾(KBr)压片法制备样本,利用定制Python脚本从PerkinElmer专有.fsm格式中提取光谱数据,经过吸收度转换、滚动基线校正和CO2干扰波段(2408-2248 cm-1)剔除等预处理后,采用包含355个输入神经元、两个隐藏层(50和25个神经元)的MLP网络进行分类。系统不仅能识别10种欧盟优先聚合物(包括PE、PP、PVC、PET、PS、PU、PA、PC、PMMA和PTFE),还涵盖样本边框、天然聚酰胺(干皮肤)和KBr背景等共14个类别。

关键技术方法主要包括:1)采用KBr压片样本制备技术确保全中红外范围(4000-1000 cm-1)测量;2)开发定制数据提取流程处理高光谱图像;3)构建多层感知机神经网络模型进行光谱分类;4)建立专家引导的半自动验证机制,通过空间聚类和参考光谱比对确保结果可靠性。

3.1. 分类性能

研究团队通过混淆矩阵和置信度阈值(0.8)评估模型性能,测试集整体准确率达到99.96%。尽管存在轻微过拟合(训练集准确率99.98%),但分类效果显著。主要误分类发生在信号强度低、类似KBr背景的光谱上。通过采用类别权重调整策略有效解决了数据集不平衡问题,确保低代表性材料也能获得准确分类。

3.2. 速度与效率提升

与传统谱库相关性方法相比,MLP分类展现出巨大效率优势。传统方法需要对每个聚合物参考谱进行单独关联计算,处理10种欧盟优先聚合物时耗时3-6小时。而MLP系统允许合并多个测量子区域("标记")数据一次性处理,对430万光谱的大数据集(13×13 mm,6.25μm分辨率)分类时间不超过30分钟,且无需复杂的光谱预处理步骤。

3.3. 分类光谱的可视化表示

研究采用空间邻近聚类策略,将相同类别且位置接近的光谱分组处理,计算平均光谱和标准差后与参考谱对比验证。这一过程生成.png格式比对图像供专家审查,有效识别了如纤维素纤维误判为聚氨酯(PU)等错误分类案例。最终通过二值化图像实现微塑料颗粒的定量分析。

3.4. 局限性与未来方向

研究指出当前模型在区分光谱特征相似的聚合物(如聚氨酯与纤维素)时仍存在挑战,训练数据集虽包含30万条光谱但主要来自原始聚合物,对环境样本中降解微塑料的泛化能力有待提升。未来将通过UV老化模拟和优化扫描协议扩展数据集多样性,并探索更复杂的神经网络架构进一步提升分类性能。

该研究成功证明了MLP神经网络在FTIR微塑料分析中的实用价值,通过半自动化工作流实现了快速准确的光谱分类。KBr压片法与MLP流程的独特结合,实现了全中红外覆盖、PTFE检测和多标记合并等优势,为人工智能辅助光谱分类奠定了坚实基础。虽然专家验证环节仍需保留,但该方法已显著降低人工工作量,为高通量微塑料筛查提供了可靠的技术路径,对推动环境污染物的标准化分析具有重要意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号