高性能计算中的自主资源采集:控制方法及其可重用性

《ACM Transactions on Autonomous and Adaptive Systems》:Autonomic Resource Harvesting in HPC: Control Methods and their Reusability

【字体: 时间:2025年11月08日 来源:ACM Transactions on Autonomous and Adaptive Systems

编辑推荐:

  HPC系统动态特性需通过在线反馈的自适应管理实现,控制理论方法为设计奠定基础但面临多种评估标准,包括性能效率、控制理论专长和跨子系统可重用性。本文以资源采样子系统CiGri为例,比较PID控制、自适应控制和模型自由控制在资源利用效率与系统可移植性之间的权衡,揭示不同控制策略在复杂HPC环境中的适用边界。

  

摘要

高性能计算(HPC)系统会受到动态变化的影响,例如作业执行时间、I/O操作量以及网络使用情况等。为了适应这些不可预测的变化,需要在在线反馈循环中采用自主管理机制。控制理论方法的引入有助于设计出基于坚实理论基础的自主管理系统。由于现有控制器的种类繁多,选择合适的方法颇具挑战性。评估控制器的标准多种多样,既包括性能和效率,也需要具备控制理论方面的专业知识,以及控制器在子系统间的可重用性和可移植性。因此,开展比较研究对于帮助设计者做出决策至关重要。
我们研究了HPC系统中的资源利用问题,其中调度策略常常导致资源闲置。我们的方法通过反馈循环来控制小规模作业的投放,以最大化资源利用率。控制的核心在于如何在资源利用与系统性能之间实现可重用的平衡。我们探讨了可重用性与控制系统适应性和鲁棒性之间的关系,并以经典的比例-积分-微分(PID)控制、其升级版本的自适应控制,以及无模型控制(MFC)为例进行说明。我们的研究对象是CiGri——一个在计算网格中收集闲置资源的系统。我们通过实验评估比较了这些控制方法的性能和可重用性。研究发现,在不同评估标准下存在权衡:自适应控制具有较高的可移植性,但其设计复杂性较高,非专业人士难以掌握;PID控制在名义性能上表现良好,但可移植性有限;MFC虽然使用门槛较低,但无法提供强有力的性能保障。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号