云环境中的动态任务调度与自适应GPU资源分配
《IEEE Transactions on Network and Service Management》:Dynamic Task Scheduling and Adaptive GPU Resource Allocation in the Cloud
【字体:
大
中
小
】
时间:2025年11月25日
来源:IEEE Transactions on Network and Service Management 5.4
编辑推荐:
GPU资源在云环境中的动态分配与多租户公平调度研究,提出结合硬件和软件的多任务调度算法,通过实时调整资源分配平衡效率与隔离性,实验显示资源利用率提升88%,任务完成时间显著降低。
摘要:
随着云计算中对计算能力需求的不断增长,图形处理单元(GPU)已成为提供强大计算能力的关键组件。由于GPU的成本较高,因此高效地分配GPU资源显得尤为重要。此外,还需要考虑云环境的特性,如动态工作负载、多租户机制以及隔离要求等。一个主要挑战是在保持资源隔离的同时,有效分配GPU资源并适应动态工作负载的变化。另一个挑战是确保调度在满足任务需求(例如完成截止日期)的同时,实现各租户之间的公平性。尽管现有的方法分别解决了这些挑战,但没有一种方法能够同时应对这两个问题。在应用程序不断请求和释放GPU资源的动态环境中,这一点尤为重要。本文提出了一种新的动态GPU资源分配方法,该方法结合了公平性和任务需求感知的调度机制。我们设计了一种新颖的算法,该算法充分利用了硬件和软件支持的GPU多任务处理能力。该算法负责任务调度,并在新任务到来时不断重新评估资源分配情况,以确保公平性;同时调整资源分配以维持隔离性并满足任务要求。实验结果表明,与现有的先进解决方案相比,我们提出的算法具有多种优势:它可将GPU资源使用率降低88%,并显著缩短任务完成时间。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号