用于训练深度学习模型的数据相关参数选择,该模型可预测云环境中应用程序性能的下降

《IEEE Transactions on Cloud Computing》:Data-Related Parameter Selection for Training Deep Learning Models Predicting Application Performance Degradation in Clouds

【字体: 时间:2025年11月13日 来源:IEEE Transactions on Cloud Computing 5

编辑推荐:

  针对云环境中应用程序性能下降问题,本文提出一种基于代理的多目标优化算法,旨在提升机器学习预测模型的准确性同时减少数据采集和存储资源消耗。通过在5G核心网络和Kubernetes云平台上的应用案例验证,该算法在Pareto前沿上的超体积达到99.5%,较传统方法减少3.58小时优化时间,显著提升资源利用效率。

  

摘要:

部署在云环境中的应用程序由于各种潜在原因(如基础设施故障)容易出现性能下降。为了保持这些应用程序的预期可用性,可以使用机器学习(ML)模型来预测即将发生的性能下降,并采取预防措施。然而,这些ML模型的预测准确性是其性能的关键指标,它受到多个因素的影响,包括训练数据量、数据采样间隔、输入窗口和预测范围。为了优化这些与数据相关的参数,本文提出了一种基于替代模型的多目标优化算法,旨在在最大化预测模型准确性的同时,最小化数据收集和存储所消耗的资源。我们通过两个用例评估了所提出的算法,这两个用例分别关注5G核心网络和部署在基于Kubernetes的云测试平台上的Web应用程序的关键性能指标(KPI)预测。实验表明,与最优Pareto前沿相比,所提出的算法能够实现99.5%的归一化超体积,并且与其他替代模型相比,搜索最优解的时间减少了0.6小时;与不使用替代模型的情况相比,搜索时间减少了3.58小时。

引言

下一代电信网络中的云环境需要满足新兴应用程序在延迟、可靠性和吞吐量方面的严格要求[1]、[2]、[3]。然而,由于各种基础设施故障或资源分配问题(如服务器硬件故障、资源竞争、负载均衡器配置错误、网络拥塞以及云管理系统调度问题),这些应用程序容易出现性能下降,从而导致服务质量(QoS)下降或服务中断[4]、[5]、[6]、[7]。为了保持部署在云环境中的应用程序的预期可用性和性能,主动管理应用程序的性能下降至关重要,这可以通过预测性能下降并采取预防措施来实现[8]、[9]。利用基于云基础设施和应用程序的性能指标数据训练的机器学习(ML)模型,可以为应用程序性能下降问题提供一种主动应对的方法。这些模型能够提取洞察并预测潜在的性能下降,从而及时采取预防措施,以维持服务的可用性和性能[8]。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号