工业多传感器数据流异常检测的混合方法:一种结合无监督与有监督学习的新策略及其在真实世界数据集上的验证

【字体: 时间:2025年10月08日 来源:Heliyon 3.6

编辑推荐:

  本研究针对现有异常检测数据集在规模和真实性上的局限性,提出了一种新颖的工业多传感器时间序列数据集,并开发了一种混合异常检测方法。该方法结合无监督与有监督机器学习技术,显著减少了人工标注需求,仅需对少量数据进行标记即可实现全数据集的精准异常识别。在公开数据集及自建数据集上的测试表明,该方法在准确率、召回率和AUC-ROC等指标上表现优异,为工业自动化过程的实时监控提供了高效解决方案,对网络安全、医疗诊断及工业流程优化具有重要意义。

  
在当今工业4.0时代,多传感器数据流异常检测已成为网络安全、医疗诊断和工业过程控制等领域的关键技术。然而,现有异常检测方法面临两大挑战:一是现有数据集往往规模有限、真实性不足,可能导致模型性能评估过于乐观;二是完全依赖无监督方法检测精度较低,而全监督方法又需要大量标注数据,实操难度极大。这些问题严重制约了异常检测技术在真实工业场景中的应用效果。
为破解这些难题,研究人员在《Heliyon》上发表了一项创新研究,提出了一种混合异常检测方法,并构建了专门针对工业多传感器数据流的新数据集。该方法巧妙结合了无监督与有监督学习的优势,首先通过无监督技术识别少量需要标注的关键数据点,再使用这些标注数据训练有监督模型,最终实现对全数据集的高效异常检测。
研究采用的关键技术方法包括:1)使用自建的工业多传感器时间序列数据集(包含9个传感器两年间的932,267条记录);2)应用10种无监督算法(VAR、DBSCAN、IF、LOF、KM、OCSVM、VAE、LSTM、GRU、GAN)进行初始异常筛选;3)采用9种有监督机器学习算法(LR、RF、NB、DT、KNN、AB、CB、GB、XGB)进行模型训练;4)通过主动学习算法进行动态阈值优化;5)使用精确度(Accuracy)、召回率(Recall)、精确率(Precision)和AUC-ROC曲线等指标进行性能评估。
数据集描述与预处理
研究人员从匿名化工业自动化处理系统中收集了多变量时间序列数据,包含9个传感器的输出指标,如电机振动(CPM)、温度、流量速率(m3/h)和泵出口压力(PSI)等。数据以每分钟间隔记录,总计932,267行。通过特定的预处理流程处理缺失数据:连续缺失5个以上实例时填充零值(代表真实异常状态),少于5个时则根据前后数据特征采用平均值或零值填充,最终生成969,869条标准化记录。
算法选择与实现
研究采用分层策略:首先使用无监督方法生成初始标注,通过计算平方误差并设置经验阈值(均值加标准差)区分异常点。特别值得注意的是,VAR模型采用20阶滞后并经过ADF平稳性检验;DBSCAN通过?距离和最小样本数参数优化聚类;而深度学习模型(VAE、LSTM、GRU、GAN)均使用ReLU激活函数和Sigmoid输出层,以MSE作为重建误差指标。
混合方法性能验证
在公开数据集(NAB的MTSF和ATSF)上的测试结果显示,混合方法显著优于随机选择标注数据的方法。其中OCSVM与CatBoost组合在ATSF数据集上达到准确率0.987、召回率0.956、精确率0.968和AUC-ROC 0.994的优异性能。通过3折交叉验证证实,该方法仅需标注26%的训练数据即可达到优于纯无监督方法的性能。
实际应用效果
在自建数据集上,仅使用3,205条记录(占总数据量0.33%)进行标注训练,多个有监督模型(RF、AB、CB、GB、XGB)均实现了接近完美的检测性能(准确率、召回率、精确率和AUC均达1.000)。预测结果可视化显示,该方法能精准捕捉真实异常区间,误报率极低。
研究结论表明,这种混合方法成功解决了大规模工业数据标注难题,在保证检测精度的同时大幅降低了人工成本。提出的多传感器时间序列数据集为后续研究提供了真实世界基准,而灵活的框架设计使其能够适应各种工业场景。尽管存在少量潜在标注误差的可能,但该方法在召回率和AUC-ROC等关键指标上的卓越表现,证明了其在工业异常检测领域的实用价值和发展潜力。
未来研究方向包括引入注意力机制增强模型解释性,采用高级优化技术微调超参数,以及探索该方法在医疗监测、网络安全等更多领域的应用可能性。这项研究不仅推动了异常检测技术的发展,也为工业4.0时代的智能监控系统提供了切实可行的解决方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号