一种基于人工智能的新型协作式智能运维框架,应用于云边计算电力网络
《RELIABILITY ENGINEERING & SYSTEM SAFETY》:A novel AI-driven framework of collaborative intelligent operation and maintenance in cloud-edge computing power networks
【字体:
大
中
小
】
时间:2025年11月21日
来源:RELIABILITY ENGINEERING & SYSTEM SAFETY 11
编辑推荐:
多阶段数据传输可靠性模型与异构资源分配优化框架在云-边缘计算电力网络网络安全中的应用研究
随着全球范围内计算能力网络的迅速发展,尤其是在物联网(IoT)和人工智能(AI)技术不断进步的推动下,云边计算能力网络(Cloud-Edge Computing Power Network, CECPN)已成为现代数字基础设施的重要基石。然而,CECPN的分布式和异构特性也带来了显著的网络安全隐患,这些隐患威胁着数据传输的可靠性,从而对系统的运行与维护(O&M)管理构成了重大挑战。当前的研究在CECPN的数据传输生命周期建模方面存在不足,较少关注在遭受网络攻击时如何进行异构资源的分配策略。本文提出了一种基于人工智能的协同O&M框架,旨在通过在遭受网络攻击时对通信、计算和运营资源的异构分配,优化多阶段数据传输的可靠性恢复与成本控制。通过在模拟的20单元CECPN环境中进行案例研究,本文展示了三种不同的O&M方法:成本导向型、可靠性导向型以及平衡策略型。研究结果验证了该框架在不同攻击场景和恢复时间窗口下生成多样化解决方案的能力。
近年来,随着全球数字化转型的加速推进,分布式计算基础设施的需求不断上升。这些基础设施需要具备处理海量数据并实现低延迟的能力,以满足现代社会对实时信息处理的高要求。中国提出的“东数西算”国家工程正是这一趋势的典型代表,通过将数据密集型任务从东部地区向资源丰富的西部地区转移,以优化能源效率并降低运营成本。因此,这种趋势催生了融合集中式云计算资源与分布式边缘计算能力的混合计算架构。CECPN作为一种新型范式,将云与边缘节点之间的分布式计算资源无缝整合,以提供统一的计算服务。通过引入先进的机器学习算法,CECPN能够基于历史数据和实时操作条件,智能预测边缘设备的工作负载,从而提高系统处理效率和资源利用率。此外,CECPN在决策智能方面也展现出卓越的适应性决策能力和复杂的数据分析能力,能够预测性地优化多场景和多模态的应用。
CECPN的架构由三个主要层级构成:物理层、AI网关层和应用层。物理层是数据采集的基础,它利用智能手机、医疗设备和交通传感器等智能终端,通过5G、Zigbee和以太网等通信技术,实时收集视频、音频、图像和能源信号等多模态原始数据。AI网关层负责对这些原始数据进行本地预处理,包括数据清洗、特征提取和协议转换。预处理后的数据上传至应用层,借助云存储和大数据建模技术,实现自动化的决策与判断。这些模型不仅能够对多场景和多模态的数据进行智能分析,还能进行动态优化,从而提升系统的整体性能。
然而,先进的网络攻击对CECPN系统构成了严重威胁,这些攻击主要针对关键的数据传输路径。常见的攻击类型包括分布式拒绝服务(DDoS)攻击、虚假数据注入(FDIA)攻击以及协调的多向攻击。DDoS攻击通常针对边缘网关,通过大量伪造请求迅速耗尽网关的计算资源,从而中断预处理服务并阻止传感器的实时数据上传。这种攻击会导致边缘集群的通信通道被淹没,网关的处理能力达到饱和,进而影响云服务的性能。FDIA攻击则通过篡改系统组件之间的传输信息,影响传感器到网关以及网关到云的通信。攻击者可以通过在边缘集群中伪造传感器读数、在网关中篡改数据聚合过程、以及在云层中污染分析结果,从而破坏数据的完整性。协调的多向攻击则结合多种攻击向量,针对数据传输的各个阶段,包括通信链路、处理节点和系统协议,实施系统化的多点攻击。这些攻击在边缘层可能通过大量流量淹没集群,同时注入虚假数据;在网关层可能通过饱和处理能力并破坏路由协议;在云层则可能通过中断服务同时保持持久访问。其目标是破坏整个系统的完整性和操作连续性。
这些安全威胁代表了分布式架构中普遍存在的挑战,因为多个节点和层级之间的互联性使得系统中的漏洞可能在整个网络中扩散。为了解决这些根本性问题并确保分布式计算能力系统的稳健运行,特别是CECPN架构,全面的可靠性与安全性工程方法已成为不可或缺的一部分。
在分布式架构的研究中,如CECPN系统,主要集中在四个方向:故障检测与诊断(FDD)、容错与冗余机制、网络攻击防御以及系统韧性增强策略。FDD在分布式计算能力网络中至关重要,用于识别系统异常并确保及时干预。研究者们已经探索了多种方法,包括机器学习、概率建模和基于传感器的异常检测。例如,Wang等人提出了一种概率图模型,用于检测智能电网中的故障,该模型考虑了网络中物理和虚拟组件之间的相互作用。Patriarca等人则针对海水淡化厂的网络基础设施,提供了一种基于仿真的网络韧性评估方法,将Simulink模型与地理参考的水分配网络相结合。CECPN中的容错机制主要关注通过冗余、备用组件和分布式控制机制,在系统发生故障时仍能维持其功能。例如,Zhao等人提出了一种战略性能源存储部署方案,以提高网络在遭受网络攻击时的韧性。Meng等人则引入了一种两阶段随机优化模型,用于在电网系统中预置移动电源和无人机,以提升系统的容错能力。Xu等人分析了可再生能源网络中的恶意软件威胁,并提出了利用预测分析和网络结构优化来增强系统韧性的策略。为了应对日益增长的网络攻击威胁,研究者们还提出了多种安全框架,如Zhao等人开发的基于启发式方法的网络韧性框架,以及Dui等人提出的针对智能电网的物联网驱动韧性方法。这些方法考虑了多个性能阶段,并综合了多层故障机制和灾难响应策略。
近年来,云边计算安全的研究重点逐渐转向主动策略,以增强系统在动态条件下的韧性。例如,Liu等人开发了一种基于可用性的在线备份方案,用于边缘环境中的虚拟网络功能,通过Drift-Plus-Penalty方法,在系统状态波动的情况下最小化服务成本并确保可用性。Qiu等人则制定了基于条件的最优任务中止策略,建立了离散时间最优停止框架,通过动态任务中止决策,最小化任务和系统故障的预期成本。Zhu等人研究了量子密钥分发(QKD)保护的数据中心网络中的通信、计算、缓存和加密资源分配问题,创新性地解决了4C资源分配挑战,以最小化加密资源消耗同时确保信息理论上的安全性。Tuli等人提出了一个半监督故障预测框架,利用生成对抗网络(GAN)生成预迁移动边缘环境中的决策,实现了通过耦合模拟和少量异常分类的主动容错。
尽管在可靠性分析和智能O&M策略方面取得了显著进展,但CECPN架构中仍存在一些关键的研究空白。首先,可靠性分析主要集中在物理层,而对数据传输层和AI处理组件的考虑相对有限。其次,当前的数据传输分析多集中于单阶段方法,缺乏对整个传输过程的协同建模,尤其是针对新兴的边缘-云协作架构。第三,现有的O&M策略多关注任务级别的中止决策或预防性维护,但在网络攻击发生时,很少平衡实时数据传输的可靠性恢复与异构资源分配的成本。最终,大多数方法未能充分应对多网络攻击场景及其对多阶段数据传输过程的不同影响。
因此,本文提出了一种新颖的AI驱动协同智能O&M框架,用于CECPN系统。该框架的主要创新点和贡献包括以下几个方面。第一,建立了一种全新的可靠性建模方法,构建了一个涵盖从边缘采集到云处理的完整数据流的四阶段数据传输可靠性模型。第二,开发了一种多目标优化框架,在网络攻击场景下同时最大化数据传输的可靠性恢复和最小化异构资源分配成本。第三,采用了多目标粒子群优化(MOPSO)算法,以协调计算、通信和运营资源的部署,实现双目标优化。第四,针对三种不同的攻击场景,制定了特定的资源分配策略,以适应不同威胁强度和对系统组件的不同影响。
本文的研究案例基于智能电网基础设施,展示了该框架的有效性。然而,提出的AI驱动O&M方法具有高度的通用性,可以适用于其他关键的CECPN应用,如自动驾驶系统、大规模工业物联网网络、智能医疗系统和分布式可再生能源管理系统。这些应用场景同样面临多阶段数据传输可靠性和在遭受网络攻击时异构资源分配的问题。
本文的其余部分结构如下:第二节介绍了在遭受网络攻击时的CECPN多阶段数据传输可靠性模型;第三节构建了在攻击情况下资源-可靠性耦合框架和资源分配策略;第四节提出了三种资源类型的成本建模方法;第五节提出了用于双目标优化的MOPSO算法;第六节通过模拟验证和案例分析展示了该框架在三种攻击场景下的性能;最后,第七节总结了研究的主要结论并提出了未来的研究方向。
为了便于读者理解,本文在表1中列出了关键符号和参数的命名表。这些符号和参数在后续章节中将被详细讨论,以支持对CECPN系统在遭受网络攻击时的可靠性分析和资源优化决策。通过这种方式,本文希望为读者提供一个清晰的理论框架和实践方法,以应对CECPN系统在复杂网络攻击环境下的运行与维护挑战。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号