
-
生物通官微
陪你抓住生命科技
跳动的脉搏
峰值功耗感知的容错混合关键性系统调度方法PPAS-MiCs:兼顾时序、可靠性与热约束的优化方案
【字体: 大 中 小 】 时间:2025年07月22日 来源:Sustainable Computing: Informatics and Systems 3.8
编辑推荐:
针对多核混合关键性系统(MCSs)中容错技术导致的热设计功耗(TDP)超标和时序约束冲突问题,研究人员提出峰值功耗感知调度方法PPAS-MiCs。该方法通过检查点技术划分任务段,动态调整调度以同时满足2-FT容错需求、时限约束和3W TDP阈值,实验显示其较传统容错技术提升35.6%调度成功率,为安全关键系统提供可靠解决方案。
随着多核平台成为混合关键性系统(MCSs)设计的主流趋势,高关键性(HC)与低关键性(LC)任务的共存引发新的挑战。传统容错技术如任务复制和重执行虽能提升可靠性,却因冗余计算导致热设计功耗(TDP)超标,可能触发动态热管理(DTM)机制而影响实时性。更严峻的是,核数增加使瞬时故障率上升,而现有方法难以兼顾时限、可靠性和3W TDP约束——这对航空电子等安全关键领域无疑是致命缺陷。
Sharif University(谢里夫大学)的研究团队在《Sustainable Computing: Informatics and Systems》发表的研究中,创新性地提出PPAS-MiCs调度框架。该方法通过三大突破性设计:基于检查点的任务分段技术、安全关键(SC)/非安全关键(NSC)核动态配对策略,以及利用静态/动态空闲时间(slack time)的功率管理机制,成功实现35.6%的调度性能提升。尤为关键的是,当系统功耗逼近3W阈值时,算法能智能回滚至最近检查点重新调度,这种"热紧急制动"特性使其在ARM Cortex-A7平台测试中始终保持TDP合规。
研究采用检查点间隔计算、WFD(最差适应递减)核映射、以及DPM(动态功率管理)三项核心技术。通过MiBench基准测试(含Bitcount、CRC32等真实任务集)构建150+任务场景,验证方法在2-FT(容2次故障)约束下的有效性。
【检查点优化分配】
通过数学推导确定各HC任务在正常(NR)和超载(OV)模式下的最小检查点数,将WLO/WHI执行段划分为可回滚单元。实验显示该设计使时间开销较传统容错减少61%。
【热感知核分区】
首创SC-NSC核动态配对架构,在不物理隔离核的前提下,通过WFD策略将HC任务优先映射至高散热核。温度模拟表明该设计使热点区域面积缩小42%。
【弹性调度机制】
利用静态空闲时间执行LC任务提升QoS(服务质量),动态空闲时间则通过DPM降压降频。在Susan任务测试中,平均功耗降低19%而不影响HC任务时限。
【对比实验】
与任务复制、重执行技术相比,PPAS-MiCs在3W TDP限制下达成100%时限满足率,而传统方法因时间冗余导致28%任务超期。Uunifast算法生成的极端场景测试中,其调度成功率领先36.5%。
这项研究为多核实时系统建立了"可靠性-实时性-热稳定性"三重保障范式。通过检查点技术的创造性应用,不仅实现故障恢复,更衍生出热约束调控新维度。研究团队Shayan Shokri等特别指出,未来可结合NMR(N模冗余)进一步提升容错能力,而框架在5G基带处理等时序敏感场景已显现应用潜力。论文中披露的150组测试数据集,更为行业提供了宝贵的基准参考。
生物通微信公众号
知名企业招聘