《Knowledge-Based Systems》:A Target-Driven Autoencoder-Based Condition Recognition Method for Blast Furnace Considering Causal Time-Delays
编辑推荐:
高炉铁冶炼过程存在多相反应和非线性特性导致的时间延迟及特征边界模糊问题,本文提出目标驱动自动编码器方法考虑因果时间延迟。通过自适应滑动窗口转移熵量化延迟关系,双尺度信息协作优化确定最优延迟序列,构建双维度自动编码器实现高效运行状态识别,实验验证其在实际数据中的有效性。
姜昭辉|卢家辉|潘东|余浩阳|孙晓东|桂伟华
中南大学,中国湖南省长沙市麓山南路932号,410083
摘要
准确识别异常状况对于维持高炉(BF)的稳定和顺畅运行至关重要。然而,高炉炼铁过程涉及复杂的多相反应和多变量相互作用,具有强烈的非线性特征。这些固有的复杂性导致炼铁过程中的数据存在时间延迟,不同状态之间的边界也较为模糊,这使得准确识别状况变得具有挑战性。为此,本文提出了一种基于目标驱动的自编码器的状态识别方法,该方法考虑了因果时间延迟因素。首先,设计了一种自适应滑动窗口传递熵度量方法来量化重构数据之间的时间延迟关系。然后,提出了一种信息协同优化算法来确定最优延迟序列并恢复数据流之间的真实对应关系。接下来,构建了一个二维目标驱动的自编码器用于状态识别,该方法同时从样本和变量维度提取二维特征,以实现高炉运行状态(BFOCR)的准确识别。该方法在包含六种不同运行状态的真实高炉数据上进行了验证,并成功识别出了异常的高炉状态,这对于确保高炉的安全生产和运行控制具有重要意义。
引言
高炉炼铁过程(BFIP)是钢铁生产中的核心工艺。高炉的运行状态直接影响生产效率、铁水质量和能源消耗。因此,准确识别高炉的运行状态对于提高冶炼效率和确保生产安全至关重要。
为了实现准确的状态识别,已经提出了多种高炉运行状态识别(BFOCR)方法,这些方法主要分为三类:基于机制的方法、基于专家知识的方法和基于数据的方法。基于机制的方法构建了高炉内部物理、化学和热力学过程的数学模型。Zhou等人[1]提出了用于物料流动模拟的对称二维稳态模型;Vynnycky等人[2]开发了用于多相运动分析的渐近轴对称模型;Li等人[3]利用质量和热量平衡原理建立了综合过程模型。然而,这些方法在参数识别和实时监控方面面临显著挑战。基于专家知识的方法利用规则数据库和推理引擎来模拟专家决策过程。Zagoskina等人[4]采用聚类分析来推导决策规则,Huang等人[5]开发了一个基于知识的多角色决策支持系统用于高炉配料成本优化;Xu等人[6]基于多逻辑规则和隶属函数构建了主观证据模型,而Spirin等人[7]建立了使用逻辑数学模型的诊断系统。然而,这些方法严重依赖专家经验,缺乏动态适应性,难以处理未包含在预定义规则中的新运行场景。
基于数据的方法通过挖掘高炉运行数据来实现状态识别。已经开发了深度学习方法来应对高炉的复杂特性。Xu等人[8]提出了时间序列-图像联合驱动的深度神经网络(TSIN)用于多源数据融合,实现了时间和视觉信息的同步处理;Lou等人[9]开发了深度静态核学习支持向量机(DSKL-SVM)来缓解高炉数据中的非平稳性问题;Amorim等人[10]引入了分层相似性搜索方法用于历史数据模式匹配和温度控制;Yang等人[11]引入了不确定性量化方法来处理重叠的高炉状态,从而在标记样本有限的情况下提高了识别可靠性。还开发了统计和基于记忆的策略。Zhao等人[12]提出了改进的多变量统计过程控制模型;Li等人[13]使用多输出模糊建模来区分单一流量指标无法区分的相似高炉状态;Weng等人[14]结合记忆和遗忘策略使用了改进的Mann-Kendall(MK)方法进行在线异常状态检测;Guo等人[15]开发了动态过程自适应核Fisher(DPAKF)算法用于多源信息分类以实现异常检测。然而,这些统计方法通常假设数据的平稳性和正态性,而这在动态高炉运行中很少成立。为了利用各自的优点,出现了结合多种算法或模型的混合方法。Xu等人[16]提出了一种基于主成分分析的故障诊断方法,结合了深度神经网络和XGBoost,实现了异常工作状态的实时监控;Zhu等人[17]将门控循环单元与高斯混合模型(GMM)结合以增强异常检测能力;Duan等人[18]将多模态特征融合算法与图卷积网络(GCN)结合以应对高特征相似性和样本数量有限的挑战。然而,这些混合方法存在模型复杂性增加和参数调整困难的问题。更严重的是,这些方法未能充分考虑时间延迟对状态识别的影响。
基于数据的方法能够在不需要深入理解机制的情况下从大型数据集中提取关键特征,显示出在BFOCR方面的巨大潜力。然而,现有的深度学习网络在处理样本变异性和多变量相关性方面存在困难,更侧重于数据重建和模式匹配而非特征与目标之间的关系。当时间延迟模糊了运行状态之间已经微妙的区别时,这种局限性变得更加严重,时间延迟掩盖了状态边界,而模糊的边界又使得特征提取变得复杂。关于时间延迟估计,Jiang等人[19]使用了皮尔逊相关系数(PCC)来减轻数据间的延迟,但仅限于线性关系;Wang和Zhao[Wang and Zhao]使用最大信息系数(MIC)进行变量选择,捕捉了非线性依赖性;Jiang等人[21]开发了基于灰关联系数(GRC)的多变量延迟估计方法,能够进行多变量延迟分析,但在处理动态过程变化时遇到困难;Zhao等人[22]从概率密度角度估计了序列延迟。这些方法的局限性在于将时间延迟视为孤立的统计属性,而不是影响动态过程演化和状态识别的系统因素。
为了解决高炉炼铁过程中多个变量之间的时间延迟估计困难以及不同运行状态类别之间模糊的特征边界问题,本文提出了一种基于目标驱动的自编码器的状态识别方法,该方法考虑了因果时间延迟。与仅关注时间对齐或特征提取的现有方法不同,我们的方法将时间延迟分析直接整合到特征学习中。主要贡献如下:
1) 设计了一种自适应滑动窗口传递熵(ASWTE)度量方法,通过分析过程数据和状态变化之间的双向因果信息流来量化数据间的时间延迟。
2) 开发了一种基于双尺度信息协同优化(DSICO)算法的延迟估计策略,通过动态尺度调整的粒子群、信息共享、周期性重组和自适应重新分配机制实现了最优延迟序列。
3) 构建了一个二维目标驱动的自编码器(DDTA)状态识别模型,通过样本贡献因子、变量权重和损失函数中的识别误差项增强了隐藏信息的提取和目标引导的特征学习。
本文的结构如下:第2节描述了问题;第3节介绍了方法论;第4节提供了实验验证;第5节总结了本文。
部分摘录
过程描述
高炉炼铁过程(BFIP)是一种通过高温还原反应从矿石中提取铁的冶金过程。如图1所示,原材料连续通过高炉喉部加入。然后热风被注入高炉炉身,在那里与焦炭燃烧生成一氧化碳。还原气体通过高炉烟囱上升,还原炉料中的铁氧化物。还原后的铁下降到高炉底部,与碳结合形成铁碳合金。
方法论
图2展示了考虑因果时间延迟的高炉目标驱动自编码器状态识别方法的流程图。首先,设计了一种自适应滑动窗口传递熵(ASWTE)指标,根据当前的延迟序列重构数据并量化时间延迟程度。随后,采用双尺度信息协同优化(DSICO)算法来捕捉多变量延迟关系和状态变化。
实验验证
本节使用真实的高炉状态数据集进行了全面的实验评估。首先,通过比较不同的延迟度量和优化算法组合来确定最优时间延迟估计模型。然后,将DDTA模型与几种最先进的识别模型进行基准测试以验证其优越性。最后,进行了消融研究以评估时间延迟估计模块和每个核心组件的单独贡献。
结论
本文提出了一种基于目标驱动的自编码器的状态识别方法,该方法考虑了因果时间延迟。开发了ASWTE指标来量化数据变量之间的时间延迟,并提出了DSICO算法来确定最优时间延迟序列和实现过程数据的时间对齐。构建了一个具有二维加权机制的DDTA模型,以实现过程变量之间潜在信息的全面提取。
姜昭辉:撰写 – 审稿与编辑、监督、方法论、资金获取、概念化。卢家辉:撰写 – 原始草稿、软件开发、方法论、形式分析。潘东:撰写 – 审稿与编辑、资金获取、数据管理、概念化。余浩阳:验证、概念化。孙晓东:验证、概念化。桂伟华:资金获取、概念化。
致谢
本工作得到了湖南省科技创新计划(项目编号2024RC1007)、湘江实验室重大项目(项目编号22XJ01005)、国家自然科学基金青年科学基金(项目编号62303491)和湖南省自然科学基金(项目编号2025JJ10007)的支持。