
-
生物通官微
陪你抓住生命科技
跳动的脉搏
凤凰城:针对移动视频应用的多实例深度神经网络(DNN)的基于温度感知的片上推理技术
《ACM Transactions on Embedded Computing Systems》:Phoenix: Thermal-Aware On-Device Inference of Multi-Instance DNNs for Mobile Video Applications
【字体: 大 中 小 】 时间:2026年02月16日 来源:ACM Transactions on Embedded Computing Systems
编辑推荐:
移动设备多DNN推理中,Phoenix系统通过强化学习动态分配异构处理器任务并设计多退出网络架构,有效延迟热 throttling,维持帧率稳定,同时优化计算精度。
本摘要是由自动化工具生成的,并非由文章作者撰写或审核。它旨在帮助读者发现相关信息、评估文章的相关性,并帮助来自相关研究领域的读者理解本文内容。它是对作者提供的摘要的补充,作者提供的摘要仍是文章的正式摘要。完整文章才是权威版本。点击此处了解更多。
点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。
AI 生成的摘要
该摘要由基于已发表文章文本的自动化系统生成。
生成日期:2026年2月5日
本文探讨了在移动设备上同时运行多个深度神经网络(DNN)所面临的挑战,重点关注热管理问题,以确保需要实时响应的视频应用能够保持性能。移动设备的计算资源有限,运行多实例 DNN 会导致大量热量产生,从而引发热节流,降低计算性能并影响应用帧率。研究介绍了 Phoenix 系统,该系统通过优化异构处理器上的任务分配,并使用自适应多出口网络在热压力下平衡准确率和延迟来提升多 DNN 推理性能。
Phoenix 采用强化学习来学习一种热感知的任务分配策略,将 DNN 任务分配到最适合的处理器上,目的是在满足延迟要求的同时延缓热节流的发生。系统会实时监测设备参数(如温度、处理器频率和利用率),根据热状况的变化动态调整任务分配决策。即使发生热节流,Phoenix 也会利用多出口网络实现早期退出,从而减轻计算负担并维持帧率。这些多出口网络是通过神经架构搜索精心设计的,考虑了热节流引起的处理器特定性能下降模式。该架构优化了早期退出的数量、位置和结构,以在满足延迟要求的同时最大化准确率。
在运行时,Phoenix 实现了两种调度策略:一种是基于当前运行条件选择最准确退出点的最佳努力调度器;另一种是持续性能调度器,它会在热压力下主动调整退出深度,以长期稳定性能。这种方法使 Phoenix 能够在保持目标帧率的同时,将早期退出带来的准确率损失降至最低。该系统已在智能手机上进行了测试,测试场景包括运行多个 DNN 进行姿态估计和面部识别的虚拟 YouTuber(VTuber)应用程序。结果表明,Phoenix 有效延缓了热节流的发生,实现了更高的持续帧率,并且能在运行时产生最小的开销下适应实时热动态。
总之,Phoenix 通过结合强化学习进行任务分配、多出口网络设计和自适应调度,为移动设备上的热感知多实例 DNN 推理提供了一种新颖且全面的方法。这种联合优化使得多 DNN 应用能够在异构处理器上高效运行,显著提升了用户体验,同时减轻了热引起的性能下降,而不会过度牺牲准确率。这项工作强调了在设计移动 AI 推理系统时考虑热动态的重要性,并为未来在其他设备和工作负载类型上的应用扩展奠定了基础。