基于特征选择与机器学习的高光谱土壤铁氧化物及锌含量定量反演研究

【字体: 时间:2025年06月26日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  本研究针对土壤重金属污染监测需求,创新性地结合高光谱技术与机器学习算法,建立了土壤铁氧化物(Fe2O3)和锌(Zn)含量的定量反演模型。研究团队通过光谱变换(CR/SNV/FD/SD)消除环境干扰,采用CARS和Boruta算法优选特征波段,构建PLSR/SVM/BPNN/XGBoost模型组合。最优模型FD_CARS_SVM预测铁氧化物的R2V达0.849,FD_Boruta_XGBoost预测Zn的R2V为0.682,为土壤污染监测提供了高效精准的技术方案。

  

土壤作为维系生态系统平衡的核心要素,其健康状况直接关系人类可持续发展。然而随着工业化进程,铅(Pb2+)、锌(Zn2+)等重金属通过"工业三废"持续侵入土壤系统,其中锌的过量积累可引发贫血、高血压等疾病。铁氧化物因其特殊吸附性能成为重金属迁移转化的"调控枢纽",但传统化学检测方法效率低下。高光谱技术虽能通过VNIR-SWIR波段(400-2500nm)反映土壤组分特征,但铁氧化物光谱易与有机质重叠,锌元素更缺乏特征吸收峰,现有反演模型存在精度不足的瓶颈。

昆明理工大学的研究团队以云南禄丰恐龙谷为研究区,创新性地构建了"光谱预处理-特征选择-机器学习"三级反演体系。研究首先采集研究区土壤样本,测定铁氧化物和锌含量后,采用SG平滑、连续统去除(CR)、标准正态变量(SNV)及一阶二阶导数(FD/SD)处理原始光谱。随后运用竞争性自适应重加权采样(CARS)和Boruta算法筛选特征波段,最终通过偏最小二乘回归(PLSR)、支持向量机(SVM)、反向传播神经网络(BPNN)和极端梯度提升(XGBoost)构建预测模型,采用决定系数(R2)、均方根误差(RMSE)和相对分析误差(RPD)评估性能。

光谱变换提升特征辨识
研究发现CR处理能有效凸显铁氧化物在580nm和850nm的特征吸收峰,FD变换则增强了锌关联的有机质特征波段(1400nm和1900nm)的区分度。经Box-Cox转换的锌含量数据更符合正态分布,建模误差降低37.2%。

特征选择算法适用性差异
CARS算法优选出的17个波段对铁氧化物解释度达87.6%,主要集中于可见光区(400-700nm);而Boruta算法筛选的23个波段更适用于锌预测,其中76.5%位于短波红外区(1900-2500nm),印证了锌与有机质/黏土矿物的协同变化机制。

机器学习模型性能对比
非线性模型整体优于线性模型:SVM在铁氧化物预测中RPDV达2.576,显示优秀预测能力;XGBoost对锌的预测R2C高达0.999,但验证集R2V降至0.682,反映锌的间接反演仍存在挑战。最优组合FD_CARS_SVM和FD_Boruta_XGBoost的RMSEV分别控制在4.478和2.697。

该研究通过多算法融合破解了土壤组分光谱重叠的难题,建立的FD_CARS_SVM模型为铁氧化物监测提供了新范式。虽然锌的间接反演精度仍有提升空间,但提出的Boruta-XGBoost组合为无特征峰元素检测开辟了新思路。研究成果发表于《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》,对实现土壤污染快速诊断、保障农产品安全具有重要实践价值,特别为西南高原矿区土壤修复提供了技术支撑。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号