面向工业物联网安全:基于联邦学习与同态加密的动态隐私保护异常检测框架DyHFL

《IEEE Internet of Things Journal》:Toward Securing IIoT: An Innovative Privacy-Preserving Anomaly Detector Based on Federated Learning

【字体: 时间:2025年12月11日 来源:IEEE Internet of Things Journal 8.9

编辑推荐:

  本文针对工业物联网(IIoT)中数据隐私保护与异常检测效率难以兼顾的问题,提出了一种基于联邦学习(FL)并结合同态加密(HE)的动态隐私保护异常检测框架DyHFL。研究通过引入滑动窗口机制和动态智能体选择策略,有效缓解了传统FL中的掉队者效应和通信瓶颈问题。实验结果表明,DyHFL在准确率、收敛速度和通信成本等方面均优于现有基线方法,为IIoT环境下安全高效的异常检测提供了创新性解决方案。

  
随着制造业和工业领域广泛应用物联网技术实现流程自动化和产品质量提升,工业物联网(IIoT)通过智能互联和远程管理显著增强了生产效率和可扩展性。然而,由于无线通信固有的广播特性,IIoT面临着严峻的网络安全风险,如命令注入攻击等网络攻击形式。这些攻击通常表现为系统行为中的异常偏差,可能预示着恶意活动或系统故障。2010年针对伊朗核电站的震网病毒攻击就是此类攻击的典型案例。特别是在早期工业系统中,由于设计时未充分考虑安全因素,此类攻击风险尤为突出。
传统基于集中式机器学习(ML)的异常检测方法虽然能够提高模型精度且易于部署,但需要将大量IIoT数据传输至中央服务器进行处理,这不仅引入了通信效率问题,更带来了严重的隐私隐患。集中式处理增加了数据泄露风险,并创造了单点故障。此外,IIoT数据持有者往往不愿与第三方共享敏感信息。因此,开发能够保护IIoT数据隐私的实用分布式异常检测系统显得尤为重要。
联邦学习(FL)作为一种分布式机器学习范式,为解决上述需求提供了前景广阔的方案。通过FL,工业智能体可以通过向中央服务器传输参数和本地模型而非原始训练数据的方式,协作训练全局模型。与集中式ML方法相比,FL不仅保护了隐私,还显著降低了通信开销。然而,FL仍然面临模型投毒和模型推断等关键威胁,攻击者可能通过拦截通信信道或攻陷聚合服务器来窃取敏感数据。
在FL框架中,通信模式的选择与隐私保护同样关键。在异构IIoT环境中,由于设备计算资源和数据多样性导致运行速度不同,通信模式类型的影响更为显著。同步FL要求所有智能体同时上传本地模型进行聚合,导致服务器必须等待最慢的设备,产生掉队者效应,拖慢整个训练进程,不适合实时或异构IIoT应用。异步FL通过接收本地模型后立即执行全局聚合来避免掉队者效应,但由于智能体在不同时间与聚合服务器通信,可能造成通信瓶颈。缓冲区FL作为折中方案被提出,但现有方法如Fed-Buff可能偏向训练速度快的智能体导致模型精度低,而其他方法如Poorazad等人的研究仅考虑训练时间且在初始轮次进行智能体选择,缺乏动态适应性。
为应对上述挑战,本研究开发了新型动态同态加密联邦学习框架DyHFL,用于IIoT异常检测。该框架通过结合HE和创新的动态智能体选择方法,同时解决隐私保护、掉队者效应和通信瓶颈三大关键挑战。HE能够在保护数据隐私的同时保持模型精度,而动态智能体选择策略则通过持续监控训练时间、通信延迟和数据大小等指标,公平平衡快慢智能体之间的参与度。
本研究主要贡献包括:提出结合深度学习和HE的工业信息物理系统网络威胁检测新方法;开发融合同步和BFL方法潜力的新型FL框架,有效解决IIoT环境中的数据异构性和资源异质性问题;设计自适应动态智能体选择方法,持续监控训练时间、通信延迟和数据大小,在训练轮次间公平平衡快慢智能体的参与;使用三种不同的工业数据集评估DyHFL框架,证明其泛化能力、鲁棒性以及相对于最先进FL基线的优越性能。
关键技术方法包括采用基于Paillier的同态加密方案保护模型参数传输,防止诚实但好奇的服务器和外部窃听者攻击;设计滑动窗口机制动态计算时间阈值,基于训练时间、通信时间和本地数据大小三个IIoT相关指标评估智能体性能;引入加权平均指标和指数加权移动平均函数,实现阈值驱动的缓冲区更新策略,确保快慢智能体的公平代表;通过两阶段训练流程,先进行初步轮次估计时间阈值,后在后续轮次中应用该阈值指导智能体选择和聚合行为。
研究结果部分通过系统实验验证了DyHFL框架的有效性。智能体选择公平性分析表明,DyHFL在掉队者智能体选择率上达到平均56.44%,几乎是BFL方法(29.62%)的两倍,同时在所有智能体配置中保持100%的快速智能体选择率,证明了其优异的公平性。
收敛速度比较显示,DyHFL在相同和不同数据分布条件下均优于AsyncFL、FedBuff、SyncFL和BFL等五种对比方法。在Gas_Pipeline数据集上,DyHFL在相同数据上的收敛速度比AsyncFL快11.9倍,比FedBuff快5.6倍,比SyncFL快5.3倍,比BFL快5.2倍。在非相同数据环境下优势更为明显,统计检验证实了这些改进的显著性。
通信成本分析表明,DyHFL通过将总通信成本分为初步轮次和后续轮次,显著降低了通信开销,特别是在智能体数量较多时效果更为明显。与AsyncFL和SyncFL相比,DyHFL的通信成本大幅降低,同时保持了模型性能。
模型性能评估显示,DyHFL在准确率、精确率和F1分数等关键指标上 consistently表现最佳, across所有数据集和条件。其成功源于平衡的智能体选择策略,确保了快慢智能体的公平代表,使DyHFL能够比其他方法更有效地处理多样化和不平衡的数据分布。
组件消融分析进一步证实了动态智能体选择是提升效率的主导因素,而HE在增强隐私的同时不会牺牲预测性能或计算效率。例如,在无标签偏移的WUSTL-IIoT数据集上,DyHFL仅需6轮即可收敛,而SyncFL需要超过320轮,同时DyHFL保持了高准确率(99.8%)和高F1分数(99.8%)。
研究结论与讨论部分指出,DyHFL框架通过整合HE与动态智能体选择,在IIoT环境中实现了强大的聚合隐私和协调收敛。与联邦迁移学习相比,DyHFL在输入空间对齐的场景中提供更强的隐私保证和公平性。当前设计面临的挑战包括HE带来的计算和内存开销可能超过嵌入式控制器和低功耗传感器的能力,以及TTP在密钥生成和分发中引入的集中化元素。未来研究方向包括采用量化或选择性加密降低计算复杂度,设计自适应参与机制让资源受限设备以降低频率参与,结合分布式密钥生成消除单点故障,以及将DyHFL的强隐私保证与FTL的跨领域适应性相结合。
本研究提出的DyHFL框架为工业信息物理系统中的异常检测提供了一种安全高效的解决方案,通过隐私保护和动态优化的有机结合,为IIoT环境下的网络安全保障提供了重要技术支撑。实验结果表明,该框架不仅在预测准确性上表现优越,而且收敛速度更快,在实际应用中展现出显著的有效性和效率优势。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号