
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于随机森林模型的低成本微塑料颗粒表征方法研究及其环境应用价值
【字体: 大 中 小 】 时间:2025年05月29日 来源:Ecological Informatics 5.9
编辑推荐:
微塑料污染日益严重,但传统光谱检测技术成本高昂。意大利研究团队创新性地采用随机森林(RF)机器学习模型,仅需降解状态、颜色、尺寸和重量四个易获取变量,即可实现聚乙烯(PE)和聚丙烯(PP)颗粒的高效分类,准确率达88.8%。该方法为资源有限地区提供了经济可行的微塑料监测方案,发表于《Ecological Informatics》。
海洋中漂浮的"塑料雪"正在成为生态系统的隐形杀手。微塑料颗粒(Microplastics, MPs)作为持久性污染物,不仅威胁海洋生物生存,还可能通过食物链进入人体。其中工业原料颗粒(pellets)因意外泄漏在海岸线大量堆积,但传统鉴定方法如傅里叶变换红外光谱(FTIR)和拉曼光谱动辄数万欧元设备投入,严重制约大规模监测。如何突破"高精度必高成本"的困局,成为全球环境科学家亟待解决的难题。
意大利研究团队在《Ecological Informatics》发表创新成果,提出基于随机森林(Random Forest, RF)算法的低成本解决方案。研究人员从西班牙、葡萄牙海岸及意大利武尔卡诺岛采集3416颗颗粒,仅测量降解状态、颜色、尺寸(1-5 mm分级)和重量(0.0016-0.0816 g)四个基础参数,通过贝叶斯优化确定RF模型超参数(100个决策树、最大深度5)。相比需要光谱数据的传统方法,该方案设备成本降低90%以上。
【材料与方法】
研究采用跨区域双队列设计:训练集来自西班牙-葡萄牙海岸3189颗颗粒(72.3% PE,26.9% PP),验证集取自武尔卡诺岛227颗颗粒(55.5% PE)。通过1 mm筛网现场采样后,实验室采用FTIR-ATR(4000-400 cm-1)标定聚合物类型,体视显微镜评估降解状态,精密天平称重,标准筛分级。数据经L2范数归一化后,采用10折交叉验证评估模型性能。
【结果】
3.1 单变量分析
颜色变量展现最强判别力(F1=0.712),透明颗粒多属PP而白色多属PE;尺寸变量效果最弱(F1=0.542),印证形态特征易受环境干扰。
3.2 特征组合
"颜色+重量"组合表现突出(F1=0.826),揭示材料密度与色素的协同判别价值;引入降解状态后三维特征集达F1=0.834,显示环境老化痕迹的增量信息。
3.4 全特征模型
四变量RF模型在训练集实现峰值性能(Accuracy=88.8%),但对武尔卡诺岛验证集的PP识别率降至83%,反映区域降解差异带来的泛化挑战。
3.5 算法比较
RF显著优于支持向量机(SVM,Accuracy=69.4%)等传统算法,其集成学习特性有效克服单一决策树(Accuracy=75%)的过拟合倾向。
【讨论】
该研究开创性地证明:无需光谱数据,仅需1/10成本即可实现接近FTIR的分类精度(PE 94.5%)。虽然较顶尖光谱-深度学习方案(如Luo等CNN-Raman法的100%准确率)仍有差距,但其在设备简易性、运算效率(最大深度5的浅层树结构)和跨区域适应性方面具有独特优势。作者特别指出,降解状态与颜色的强相关性(r=0.723)可能反映PP更易光氧化变黄的化学特性,这为后续环境暴露史反演提供了新思路。
这项研究为发展中国家海岸监测提供了"望远镜+显微镜"的创新范式——既通过宏观特征快速筛查,又借助机器学习挖掘微观环境印记。随着模型纳入更多聚合物类型(如PET、PS)和气候带数据,这种"轻量化"策略或将成为全球微塑料普查的重要工具,助力实现联合国可持续发展目标(SDG 14.1)的海洋清洁承诺。
生物通微信公众号
知名企业招聘