基于河马优化算法和双隐藏层极限学习机的煤空气干燥基础硫含量检测模型
《ACS Omega》:Coal Air-Dry Basis Sulfur Content Detection Model Based on Hippopotamus Optimization Algorithm and Two Hidden Layer Extreme Learning Machine
【字体:
大
中
小
】
时间:2025年10月30日
来源:ACS Omega 4.3
编辑推荐:
煤硫含量智能检测方法研究。采用LIBS光谱技术结合小波变换去噪和主成分分析降维,构建双隐层极端学习机(TELM)模型,并利用hippopotamus优化算法(HO)优化第一隐层参数。实验表明HO-TELM模型检测精度显著优于传统ELM和PSO-TELM算法,其均方根误差(RMSE)低至0.0124,相关系数达0.9980,为非破坏性煤质检测提供高效解决方案。
煤作为一种重要的能源资源,在中国有着举足轻重的地位。准确分类和检测煤炭成分对于高效利用和工业生产具有重要意义。传统的煤炭空气中干燥基硫含量检测方法通常具有破坏性、耗时长和成本高的缺点,难以满足现代工业对煤炭质量检测快速和精确的需求。因此,研究者们正在探索新的技术手段,以实现非破坏性、快速且精确的检测方法。本研究创新性地将机器学习算法应用于激光诱导击穿光谱(LIBS)的数据处理,以深入检测煤炭中的硫含量。通过引入改进的模型和优化算法,本研究为智能煤炭资源检测提供了一种高效可靠的新方案。
### 煤炭与硫含量检测的重要性
煤炭是地球历史形成的有机岩石,主要由碳、氢、氧、氮、硫和磷等元素构成。在煤炭加工和使用过程中,硫的含量是一个重要的质量指标。高硫煤在煤炭配比中占比较高,不仅会增加焦炭中的硫含量,还会影响脱硫工艺的负担。在燃烧或其他使用过程中,煤炭中的硫会形成酸雨,对环境造成严重影响,特别是当煤炭中含有有机硫时,这种影响更为显著。因此,对煤炭中总硫含量的准确检测对于环境治理和煤炭工业的可持续发展具有重要意义。
### 传统检测方法的局限性
目前,煤炭中总硫含量的检测通常采用灰法、库仑滴定法和高温燃烧中和法。这些方法虽然具有一定的检测精度,但操作复杂,需要准备诸如氢氧化钠和硅胶等化学试剂,难以实现快速检测。此外,传统的手动分类方法依赖于矿工的经验,其准确性和效率难以满足现代工业对煤炭质量检测的高标准要求。因此,亟需一种快速、非破坏性和高精度的煤炭检测技术。
### LIBS技术的优势
LIBS是一种基于激光与物质相互作用产生的发射光谱分析物质组成和浓度的技术。该技术使用高能脉冲激光照射样品表面,使样品局部区域瞬间吸收大量能量并发生汽化和电离,形成高温高能密度等离子体。等离子体中的原子、分子和离子在高能态下通过电子跃迁释放出具有特征的光谱,覆盖紫外至红外波段。通过光谱仪采集并分散这些特征光谱,并结合先进的算法进行分析,可以识别样品中的元素种类,并利用光谱强度进行定量分析。
LIBS技术具有许多优点,如检测速度快、能够在原位进行多元素同步检测、检测精度高、能够实现非破坏性检测以及实时检测。这些特性使其在煤炭检测中具有很大的应用潜力。例如,Xiao和Yan提出了基于光谱的智能煤炭分类方法,显著优于传统方法在准确率、成本效益和时间效率方面。Liu等人将其应用于塑料废弃物的化学分析,Zou等人提出了改进的Meta-ELM方法,有效解决了ELM在最小化训练误差时的过拟合问题。此外,Zhang等人将其应用于水泥中氯离子的检测,开发了一种新的LIBS系统并取得了显著成果。
### 数据预处理方法
在进行LIBS光谱分析之前,数据预处理是必不可少的。为了提高数据质量,本研究采用了小波变换方法进行去噪处理。小波去噪是一种基于多分辨率时频分析的信号处理方法,能够在去除噪声的同时保留信号的局部突变特性。在此基础上,研究使用了基于信噪比(SNR)和相对峰值误差(REPV)的综合评估指标,以评估去噪效果,并选择合适的参数。
其中,信噪比(SNR)反映了信号中噪声的相对含量,计算公式为:
$$ \text{SNR} = 10 \log_{10} \left( \frac{P_s}{P_z} \right) $$
其中,$P_s$ 是信号功率,$P_z$ 是噪声功率。若去噪效果更好,则信噪比应更高。相对峰值误差(REPV)的计算公式为:
$$ \text{REPV} = \frac{|v_0 - v_d|}{v_0} \cdot 100\% $$
其中,$v_0$ 是原始信号峰值,$v_d$ 是去噪后信号峰值。REPV值越小,去噪效果越理想。为了综合考虑,研究联合评估1/SNR和REPV的归一化结果,形成一个综合评估指标,其计算公式为:
$$ Q = G_{1/\text{SNR}} + G_{\text{REPV}} $$
其中,$G_{1/\text{SNR}}$ 和 $G_{\text{REPV}}$ 分别是1/SNR和REPV的归一化结果。为了使去噪效果更理想,应尽可能减小Q值。
在多次实验后,研究选择了阈值为heursure,小波函数为sym6,分解层数为4。此时,小波变换去噪效果最佳,信噪比为64.3508,REPV为0.0018,Q值为0。
为了降低高维数据对模型的影响,本研究采用主成分分析(PCA)方法对数据进行降维处理。PCA的核心原理是将原始的高维变量空间投影到低维正交子空间,从而构建一组信息不重叠的正交主成分。这些主成分基于其对应的特征值大小,按顺序捕捉原始数据协方差结构中的最大变化方向。该过程在尽可能低的维度下保留了数据集的主要变化特征和所有信息,提高了模型性能并缓解了过拟合问题。
通过PCA处理,原始15,527维的光谱数据被降维为7维,即输入变量从15,527变为7,从而在一定程度上简化了模型。PCA处理后的数据结果如图2所示。
### 极端学习机(ELM)的介绍
ELM是一种用于单隐层前馈神经网络(SLFNs)学习的新型方法。它通过随机生成输入层到隐层的权重和隐层偏置,然后通过最小二乘法计算输出层权重,从而避免了传统神经网络需要迭代调整权重的繁琐过程。ELM具有快速训练和强大泛化能力的特点,已被广泛应用于光谱数据分析任务中。
例如,Wang等人将ELM用于汽油辛烷值的测定,Mao等人结合堆叠自编码器(SAE)和ELM用于镁石分类,Li等人开发了一种结合信息熵加权的堆叠ELM架构,用于紫外-可见光谱测定地表水中亚硝酸盐-氮。Xiao等人利用光谱技术结合深度学习,建立了DR_TELM模型,用于煤炭质量的快速分析。Zou等人提出了改进的Meta-ELM方法,有效解决了ELM在最小化训练误差时的过拟合问题。
ELM模型的输出可以通过以下公式计算:
$$ o_j = \sum_{i=1}^{L} \beta_i g(w_i \cdot x_j + b_i) $$
其中,$o_j$ 是第j个样本的输出,$w_i$ 是输入层到第i个隐层节点的连接权重,$b_i$ 是隐层节点的偏置,$g(\cdot)$ 是激活函数。在本研究中,使用Sigmoid函数作为激活函数。为了提高模型的预测精度,研究还引入了损失函数E,其公式为:
$$ E = \sum_{j=1}^{N} \left( \sum_{i=1}^{L} \beta_i g(w_i \cdot x_j + b_i) - t_j \right)^2 $$
其中,$t_j$ 是第j个样本的真实值,$N$ 是样本数量。通过最小化该损失函数,可以优化模型的预测性能。
### 鸭嘴兽优化算法(HO)的介绍
鸭嘴兽优化算法(HO)是一种新颖的元启发式算法,由Mohammad Hussein Amiri等人提出,旨在解决各种复杂的优化问题。该算法模拟了鸭嘴兽群体的典型行为模式,包括好奇心探索、防御性威慑和逃离危险等行为,使搜索代理(候选解)能够在解空间中实现从随机探索到高效优化的转变,最终逼近全局最优解。
在本研究中,HO算法被用于优化TELM网络的隐层参数。通过将HO算法与TELM网络结合,可以有效提高模型的预测精度和泛化能力。HO算法的维度公式为:
$$ \text{dimension} = |IW| + |B| + |IW1| + |B1| + |TLW| $$
其中,$IW$ 和 $B$ 是输入层到隐层的权重和偏置,$IW1$ 和 $B1$ 是隐层到输出层的权重和偏置,$TLW$ 是隐层节点的权重。
在探索阶段,鸭嘴兽群体在全局最优个体(Dominant_hippopotamus)的指导下进行位置更新。位置更新公式包含两种策略。策略1是基于当前最优个体的线性更新,公式为:
$$ X_{P1}(i, :) = X(i, :) + rand \cdot (X_{best} - I1 \cdot X(i, :)) $$
其中,$X_{P1}(i, :)$ 是第i个鸭嘴兽的新位置,$X(i, :)$ 是当前位置,$X_{best}$ 是全局最优位置,$I1$ 是一个随机系数,$rand$ 是一个随机数。策略2是基于随机群体均值的动态调整,公式为:
$$ X_{P2}(i, :) = X(i, :) + A \cdot (X_{best} - I2 \cdot mean\_group) $$
其中,$A$ 是一个随机系数矩阵,$I2$ 是一个随机整数(1或2),温度因子的计算公式为:
$$ T = e^{-t/\text{max\_iterations}} $$
其中,$t$ 是当前迭代次数,$\text{max\_iterations}$ 是最大迭代次数。当温度因子大于0.6时,采用策略2进行位置更新;否则,随机选择或重新初始化。
在防御阶段,模拟鸭嘴兽对随机生成的捕食者的防御行为,位置更新公式为:
$$ X_{P3}(i, :) = RL(i, :) \cdot predator + \frac{b}{c - d \cos(l)} \cdot \text{distance\_leader} $$
其中,$RL$ 是基于Lévy飞行的扰动项,用于增强全局搜索能力,$b$ 和 $c$ 是随机数,$d$ 是随机数,$l$ 是随机相位角,$\text{distance\_leader}$ 是距离领导者的距离。当逃离捕食者(局部探索)时,鸭嘴兽在局部范围内进行精细搜索,位置更新公式为:
$$ X_{P4}(i, :) = X(i, :) + rand \cdot (lower\_bound + D \cdot (upper\_bound - lower\_bound)) $$
其中,$D$ 是随机方向向量,$rand$ 是随机数,$lower\_bound$ 和 $upper\_bound$ 是下界和上界。
### TELM与HO的结合
在本研究中,TELM网络的隐层参数由HO算法进行优化。TELM是一种具有两个隐层的网络,每个隐层的神经元数量相同,并且完全连接。Xiao等人利用粒子群优化算法(PSO)与TELM网络相结合,实现了铁矿石光谱分类的优异结果。
在本研究中,HO-TELM算法被用于优化TELM网络的隐层参数。该算法的步骤如下:
1. 初始化种群。设置种群大小为40,最大迭代次数为50,最小适应度变化阈值。
2. 遍历种群中的每个个体,计算基于TELM的输出权重矩阵和RMSE(均方根误差),作为个体的适应度值。
3. 比较当前个体的适应度值与历史最优位置,并更新个体最优位置。根据适应度值筛选全局最优位置。
4. 生成捕食者的随机位置,并更新每个个体的位置矩阵,直到局部收敛。
5. 计算适应度变化,重新计算更新后的RMSE,并计算适应度变化ΔRMSE = |RMSE_new - RMSE_old|。
6. 判断终止条件,若ΔRMSE < ε或达到最大迭代次数,则进入步骤7;否则返回步骤3继续迭代。
7. 输出最优参数,并将全局最优位置的参数矩阵作为TELM网络的第一个隐层的参数。
该算法的流程如图4所示。
### 实验与分析
本研究在MATLAB 2024a环境下,使用Intel Core i7–12700H CPU和NVIDIA GeForce RTX 3060 GPU(6 GB VRAM)进行实验。实验环境控制在温度22 ± 2 °C,湿度50% ± 10%的范围内。
经过小波去噪和PCA降维处理的数据集被用于验证模型的性能。在进行实验时,将数据集分为训练集和测试集,并使用K折交叉验证方法评估模型性能。K折交叉验证是一种稳健的模型性能评估技术,其步骤如下:
1. 将整个样本集随机分为K个子集。
2. 在每次试验中,选择一个子集作为验证集,其余K-1个子集作为训练集进行模型构建。
3. 整个过程重复K次,确保每个子集都有机会作为验证集。
4. 最终使用K次试验的结果的平均值作为模型性能的最终度量。
通过该方法,每个样本都有机会参与训练和验证过程。
在实验中,使用了10次循环模拟的平均值作为回归模型的评估效果。TELM和ELM模型的预测准确率分别如图5和图6所示。图5展示了ELM模型对煤炭空气中干燥基硫的预测结果,图6展示了TELM模型的预测结果。
从表1中可以看出,TELM模型的RMSE为0.2010,R值为0.8948,而ELM模型的RMSE为0.7885,R值为0.3607。这表明TELM模型的预测精度显著优于ELM模型。
为了进一步提高模型的预测精度,本研究引入了HO算法对TELM模型进行优化。HO-TELM模型使用了17维的光谱数据(经过小波变换和PCA降维处理)作为输入,并输出煤炭空气中干燥基硫含量。当模型初始化时,HO算法的种群大小设置为40,最大迭代次数为50,隐层节点数为8。经过10次循环模拟后,取平均值作为回归模型的评估效果。
表2展示了PSO-TELM和HO-TELM模型的平均指标。PSO-TELM模型的RMSE为0.0399,R值为0.9105;HO-TELM模型的RMSE为0.0124,R值为0.9980。显然,HO-TELM模型的预测精度优于PSO-TELM模型,表明HO算法在优化TELM模型方面具有显著优势。
此外,本研究还进行了灵敏度分析,探讨了HO算法种群大小和最大迭代次数对模型性能的影响。图9展示了种群大小对模型性能的影响,图10展示了最大迭代次数对模型性能的影响。实验结果显示,当种群大小为40,最大迭代次数为50时,模型性能最佳。种群大小低于40时,RMSE值不够精确;种群大小超过40后,结果与40时基本一致,表明种群大小为40已经足够找到最优解。最大迭代次数低于50时,RMSE值不够精确;最大迭代次数超过50后,结果与50时基本一致,表明50次迭代已经足够找到最优解。增加迭代次数但不改变RMSE值,可能意味着最优解已经被找到,从而浪费计算资源并降低检测速度。
### 结论
为了克服传统方法在检测煤炭空气中干燥基硫含量时的破坏性和低效性,本研究引入了一种基于LIBS的双隐层极端学习机(TELM),并采用鸭嘴兽优化算法(HO)对其进行参数优化。通过MX2500+光谱仪采集的15,527维光谱数据,结合小波变换和主成分分析进行降维处理,并利用K折交叉验证将数据集分为训练集和测试集。随后,构建了一个高精度、低复杂度的煤炭成分检测框架。
实验结果表明,HO-TELM算法在煤炭空气中干燥基硫含量预测中达到了RMSE = 0.0124和R = 0.9980,优于传统的ELM(RMSE = 0.7885)、TELM(RMSE = 0.2010)和PSO-TELM(RMSE = 0.0399),验证了该方法的有效性和优越性。
此外,HO-TELM算法不仅在检测煤炭空气中干燥基硫含量方面表现出色,其强大的适应性和鲁棒性也表明其在检测其他主要煤炭成分方面具有广阔的应用前景。同时,TELM的强大分类能力也为煤炭分类提供了广泛的未来应用潜力。展望未来,TELM模型可能与更先进的算法相结合,以实现更广泛的应用,如医疗、制造和能源调度等领域。
虽然LIBS技术在检测煤炭空气中干燥基硫含量方面已经取得了显著成果,但在数据处理和模型优化方面仍有改进空间。为了更好地检测煤炭空气中干燥基硫含量,可以考虑引入近红外光谱数据,以进一步获得煤炭空气中干燥基硫含量的光谱数据。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号