云环境中的动态任务调度与自适应GPU资源分配

《IEEE Transactions on Network and Service Management》:Dynamic Task Scheduling and Adaptive GPU Resource Allocation in the Cloud

【字体: 时间:2025年11月25日 来源:IEEE Transactions on Network and Service Management 5.4

编辑推荐:

  GPU资源在云环境中的动态分配与多租户公平调度研究,提出结合硬件和软件的多任务调度算法,通过实时调整资源分配平衡效率与隔离性,实验显示资源利用率提升88%,任务完成时间显著降低。

  

摘要:

随着云计算中对计算能力需求的不断增长,图形处理单元(GPU)已成为提供强大计算能力的关键组件。由于GPU的成本较高,因此高效地分配GPU资源显得尤为重要。此外,还需要考虑云环境的特性,如动态工作负载、多租户机制以及隔离要求等。一个主要挑战是在保持资源隔离的同时,有效分配GPU资源并适应动态工作负载的变化。另一个挑战是确保调度在满足任务需求(例如完成截止日期)的同时,实现各租户之间的公平性。尽管现有的方法分别解决了这些挑战,但没有一种方法能够同时应对这两个问题。在应用程序不断请求和释放GPU资源的动态环境中,这一点尤为重要。本文提出了一种新的动态GPU资源分配方法,该方法结合了公平性和任务需求感知的调度机制。我们设计了一种新颖的算法,该算法充分利用了硬件和软件支持的GPU多任务处理能力。该算法负责任务调度,并在新任务到来时不断重新评估资源分配情况,以确保公平性;同时调整资源分配以维持隔离性并满足任务要求。实验结果表明,与现有的先进解决方案相比,我们提出的算法具有多种优势:它可将GPU资源使用率降低88%,并显著缩短任务完成时间。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号