OnlineADS：一种针对WSNs（无线传感器网络）的在线主动学习入侵检测方法

《Computer Networks》：OnlineADS: An Online Active Learning Approach to Intrusion Detection for WSNs

【字体：大中小】 时间：2026年02月11日 来源：Computer Networks 4.6

编辑推荐：

　　在线主动攻击检测框架OnlineADS结合流式主动学习和在线深度SVDD，解决了无线传感器网络实时检测与标注成本高的问题，在三个数据集上平均AUC达76.32%-87.24%。

Hiba Tabbaa | Mourad Jabrane | Imad Hafidi

IPIM实验室，摩洛哥苏丹穆莱·斯利曼大学国家应用科学学院，贝尼梅拉尔

摘要

物联网（IoT）已在许多关键领域得到应用，包括医疗保健、环境监测、智慧城市、自动驾驶汽车和能源管理，其中无线传感器网络（WSNs）被广泛用作这些应用的基础设施。然而，WSNs仍然极易受到快速出现的新类型网络攻击的威胁。WSN数据流的动态和非静态特性要求学习方法能够进行实时分析并适应新的、不可预测的攻击类型。尽管将人工智能（AI）与入侵检测相结合具有巨大潜力，但现有解决方案面临大量标记数据的需求、定期离线重新训练的必要性以及实时检测的要求。为了克服这些限制，我们提出了OnlineADS，据我们所知，这是第一个用于WSNs的在线主动攻击检测框架。OnlineADS提出了一个基于概率校准的Online DeepSVDD扩展，结合了预算化的主动学习（AL）和漂移感知的适应机制。我们使用预序（先测试后训练）协议在WSN-DS、NSL-KDD和UNSW-NB15数据集上评估了OnlineADS的性能，主要指标是平均AUC和运行时间。广泛的流式实验表明，在标记预算有限的情况下，OnlineADS始终优于无AL的在线基线方法，同时降低了注释成本并保持了适用于资源受限WSNs的实时检测性能。在测试的查询策略中，StreamProbabilisticAL在WSN-DS、NSL-KDD和UNSW-NB15数据集上分别获得了最高的平均AUC（87.24%、84.04%和76.32%）。

引言

在过去十年中，传感器和无线通信技术的显著进步催生了无线传感器网络（WSNs）[1]。最初，WSNs被军事和环境领域用于战场监视和天气监测等用途，现在其应用范围已迅速扩展[2]。由于其简单性、有效性、易于部署和成本效益，它们已成为医疗保健、工业自动化、电信、智慧城市和农业等多种应用的可行选择。

WSN由分布在感兴趣区域的一组传感器节点组成，这些节点通常被称为传感器场，用于监测和收集环境及物理条件，并将数据发送到基站进行后续处理[6]。该网络提供了包括监控、跟踪、处理甚至控制物理世界操作在内的多种功能。值得注意的是，WSNs设计用于在不仅危险或对人类不可进入，而且传统网络建立困难的环境中运行。

尽管WSNs在各种应用中取得了成功，但其设计的简单性是一把双刃剑。一方面，它简化了部署过程；另一方面，也带来了诸多挑战，如通信能力有限、处理能力不足、内存和能源资源有限。这些限制往往与它们电池的小尺寸有关。毫无疑问，能够提供长时间的服务是WSNs的重要特性；因此，网络寿命可以说是它们最重要的服务质量（QoS）指标[7]。

像大多数网络通信系统一样，WSNs也容易受到安全威胁和攻击[8]。它们的操作限制加上恶劣环境的影响，使它们特别容易受到从物理层到应用层的各种攻击。鉴于它们在关键应用中的作用，增强其安全特性至关重要。这些网络具有动态拓扑结构且以数据为中心，因此需要专门的研究来满足实时、节能和可靠的操作需求[9]。开发强大的安全措施以保护网络免受各种类型的攻击是一个重要的研究焦点。以下攻击方法可能影响WSNs：干扰、窃听、数据包重放、数据包篡改或欺骗、节点复制，以及Sybil、蠕虫洞、水洞、DoS（拒绝服务）攻击、节点破坏以及通过受损节点注入虚假消息等。

不幸的是，仅依靠防火墙、访问控制等被动防御措施不足以防止所有网络攻击。入侵检测作为一种主动安全措施，能够监控网络系统的运行状态以检测各种形式的入侵，无论是内部还是外部攻击，甚至是错误操作。这使得网络系统可以根据需要采取适当的拦截和响应措施[10]。多项研究提出了各种入侵检测系统（IDS）来保护网络免受恶意入侵，并能够有效地检测和应对这些安全威胁[11]。

入侵检测系统（IDS）通常分为两类：基于签名的IDS和基于异常的IDS。基于签名的系统假设攻击方法的细节已经已知，并且特定的入侵模式已被预先定义。当匹配发生时，会触发警报。虽然这些系统易于部署和管理，并且对已识别的攻击具有高检测率，但它们的局限性在于无法检测新的或未知的攻击方法，这使得它们容易受到使用新颖技术的攻击者的规避。

另一方面，随着攻击方式的不断演变，对更灵活的入侵检测解决方案的需求变得越来越迫切。基于异常的IDS应运而生，旨在识别偏离正常行为的异常流量模式。通过分析特定特征，基于异常的IDS可以捕捉到关键模式，任何这些模式与观察到的活动之间的差异都可能触发警报。因此，基于异常的IDS非常适合检测以前未知的攻击[12]。

因此，在WSNs中实施异常检测（AD）对于确保收集数据的准确性和信息收集者的决策过程的有效性至关重要[13]。

研究提出了多种基于异常的WSN IDS方法，采用了统计技术、基于最近邻的方法和数据挖掘[14]、[15]、[16]、[17]。提高检测能力的主要推动力是人工智能（AI）的进步。特别是机器学习（ML）[18]的应用越来越受到重视，越来越多的研究人员利用其潜力进行AD。人工神经网络[19]、[20]和进化计算[21]、[22]、[23]进一步强调了将AI与入侵检测技术相结合的前景。这些共同努力在该领域取得了显著成果，带来了新的进展和更高的检测能力。

在这种情况下，一个重要的挑战是定义异常的标准具有不确定性，因为它很大程度上取决于具体的用例，这给创建普遍适用的检测系统带来了困难。虽然AD在处理不可预测的攻击方面表现出色，但它需要大量的历史数据才能发挥最大潜力[24]。在WSN网络安全中，由于实际场景中标记数据的稀缺性，集成机器学习技术（MLTs）进行入侵检测变得更加复杂，这是最大的障碍之一[25]。

传统的监督机器学习模型严重依赖标记数据来学习将网络行为分类为正常或入侵的潜在模式。手动获取这些标签非常耗时且成本高昂。通常需要专家知识来确保标签的准确性，这进一步增加了复杂性和成本。此外，实时或接近实时的检测能力需求使得漫长的模型训练过程成为一个重大缺点。WSNs的动态特性要求在线学习（OL），以便进行持续更新，尤其是由于新类型的攻击可能不可预测地出现。这些模型必须经常进行修订以维护网络安全。然而，这种持续适应过程带来了一个重大挑战：它依赖于标记数据集的可用性，从而再次遇到了数据缺乏的问题。

为了解决这些挑战，主动学习（AL）提供了一种非常有前景的方法。主动学习（AL）[26]是一种专门的ML形式，它通过允许模型选择性地查询最具信息量的示例来进行专家标记，从而减少了对大量标记数据的需求。这种方法旨在在最小化标记时间和成本的同时实现高准确性，从而加快了模型训练的速度。因此，AL作为一种实用的方法，有助于提高WSNs中的实时入侵检测能力，在速度、成本和准确性之间提供了有效的平衡。

尽管有一些WSN-IDS研究开始使用AL[28]，但它们仍然依赖于离线的、基于池的策略。据我们所知，之前没有WSN-IDS同时提供（i）实时流处理、（ii）基于流的AL并遵守预算限制，以及（iii）避免手动调整阈值的深度学习器。填补这一空白是本工作的核心目标。具体来说，我们的贡献包括：

OnlineADS：我们引入了OnlineADS，这是第一个将基于流的主动学习与OnlineDeepSVDD相结合的WSN IDS。与大多数专注于离线基于池的策略的不同，OnlineADS解决了动态环境中在线学习的关键挑战，允许检测器在严格标签预算下实时更新。

基于概率校准的Online DeepSVDD：我们引入了一种超轻量级的映射方法，将原始的OnlineDeepSVDD分数转换为伪概率。这种校准对于熵、边际和变异比率查询策略是必需的；没有它，这些策略将退化为随机采样。据我们所知，之前的工作没有为DeepSVDD提供这样的概率校准层。

资源感知的在线网格搜索：为了在实时环境中提高性能，我们将网格搜索应用于OnlineDeepSVDD的配置。进行了广泛的测试以确保模型有效满足WSN的实时要求。

全面评估：我们进行了广泛的研究，以检查和比较各种基于流的AL策略的影响，包括基于不确定性的、基于密度的和混合方法。我们的分析涵盖了不同数据不平衡严重程度的多个预算设置，提供了每种策略效果的详细评估。

本工作的其余部分结构如下：第2节回顾了先前的研究。第3节介绍了研究中使用的所有概念和技术的简要概述。第4节详细解释了所提出的方法。第5节详细介绍了实验和我们的研究结果。最后，第6节讨论了未来的工作。

初步介绍

本节提供了所使用技术的简要说明以及一些符号的说明。

方法论

在本节中，我们详细介绍了我们的方法论。首先，我们描述了OnlineDeepSVDD分类器的结构，介绍了我们方法中使用的校准概率映射和AL策略。最后，我们概述了我们的新型集成在线主动DeepSVDD模型。

实验和结果

本节详细介绍了我们基于DeepSVDD（OnlineADS）的在线主动攻击检测方法的实验验证，使用了WSN-DS、NSL-KDD和UNSW-NB15数据集。这些实验的设置及其结果在以下小节中进行了说明。

结论

入侵检测是WSNs实际应用中亟需解决的关键问题之一。随着服务领域的不断扩大和数据量的迅速增加，不应忽视WSNs中网络攻击的威胁和后果。大多数现有的入侵检测系统只能处理特定类型的攻击，对未知攻击无能为力。在我们的研究中，我们提出了OnlineADS，这是一种旨在执行AL的新算法

未引用的参考文献

缺失的引用 [3]、[4]、[5]、[50]

支持数据的可用性

WSN-DS数据集可在⁶获取。NSL-KDD数据集可在⁷获取。UNSW-NB15数据集可在⁸获取。

代码可用性

代码可根据合理请求提供。

资助

作者未获得这项研究的任何财务支持。

CRediT作者贡献声明

Hiba Tabbaa：写作 – 审稿与编辑，撰写原始草稿，方法论，调查，形式分析，概念化。Mourad Jabrane：可视化，验证。Imad Hafidi：验证，监督。

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

摘要

引言

相关工作

相关研究