在线知识蒸馏与深度监督在HRNet中的应用:用于早产儿姿态估计的绿色人工智能技术
《ACM Transactions on Computing for Healthcare》:Online Knowledge Distillation and Deep Supervision in HRNet: Green AI for Preterm Infants’ Pose Estimation
【字体:
大
中
小
】
时间:2025年11月07日
来源:ACM Transactions on Computing for Healthcare
编辑推荐:
本研究提出结合知识蒸馏(KD)和深度监督(DS)优化HRNet网络,用于降低新生儿肢体姿势估计的计算成本。通过OKD在HRNet的不同子网络间传递知识,并辅以DS强化监督,在BabyPose数据集上验证,HRNet3在保持93.58%平均精度的同时,参数量仅为HRNet4的28.51%(原为95.13%),FLOPs减少61.7%,且在碳排放和硬件需求上显著优于传统方法,有效平衡性能与可持续性需求。
### 解读:绿色人工智能在新生儿运动评估中的应用
随着人工智能(AI)技术的快速发展,其在医疗领域的应用也日益广泛。然而,当前的研究趋势主要集中在追求高性能的“红色AI”(red AI)模型上,这些模型虽然在某些任务中表现优异,但往往伴随着高昂的经济成本和环境代价。特别是在医疗领域,这种高成本可能会加剧资源分配不均的问题,使得先进的AI技术仅能服务于少数具备资源的机构或患者,从而违背了公平性和可持续性的原则。为了解决这一问题,研究者们提出了“绿色AI”(green AI)的理念,旨在通过优化模型的效率与可持续性,使AI技术更加普惠,同时减少其对环境的影响。
在本研究中,绿色AI的原则被应用于一个具体的医疗场景:通过深度摄像头采集的视频,对早产儿的肢体运动进行分析,以辅助早期识别神经发育障碍。这一任务的挑战在于,传统的深度学习模型通常需要大量的计算资源,且训练和部署成本较高,这在医疗资源有限的环境中尤为明显。因此,研究者们尝试通过结合知识蒸馏(Knowledge Distillation, KD)和深度监督(Deep Supervision, DS)两种技术,来降低HRNet模型的计算成本,同时保持其性能。
#### 一、研究背景与动机
早产儿的肢体运动是评估其未来神经发育情况的重要指标。然而,目前的临床评估方法存在诸多问题,如主观性强、耗时长、成本高,且难以检测到细微的运动变化。为了弥补这些不足,研究者们开发了基于深度学习的临床决策支持系统(Clinical Decision Support Systems, CDSS),以实现自动化、实时的运动分析。然而,这些系统往往依赖于复杂的模型结构,导致计算和能源消耗较高,限制了其在医疗实践中的应用。
为了在保持模型性能的同时降低计算负担,研究者们提出了结合KD和DS的解决方案。其中,KD是一种通过将大模型(教师模型)的知识传递给小模型(学生模型)的技术,旨在在不增加模型复杂度的情况下提升性能。而DS则是在模型的中间层直接使用真实标签进行监督,有助于模型在训练过程中提取更具代表性的特征,并改善梯度传播的效果。这两种技术的结合,为构建高效且可持续的深度学习模型提供了新的思路。
#### 二、研究方法与技术细节
HRNet是一种多阶段的卷积神经网络(Convolutional Neural Network, CNN),它通过在不同分辨率下处理图像特征,实现了高精度的人体姿态估计。HRNet的架构由四个并行的子网络组成,每个子网络负责处理不同分辨率的特征图,并通过交换块(exchange blocks)实现多分辨率特征的融合。这种设计使得HRNet能够在不丢失高分辨率信息的情况下,提取更丰富的特征表示。
在本研究中,HRNet的多个子网络(HRNet2、HRNet3、HRNet4)被用于测试不同的KD和DS配置。具体来说,研究者们探索了三种主要的KD策略:OKD(Online Knowledge Distillation)、MS-OKD(Multi-Student OKD)和COKD(Cascaded OKD)。OKD是一种单阶段的知识蒸馏方法,教师模型与学生模型同时训练,而MS-OKD和COKD则涉及多个子网络之间的知识传递。DS则是在学生模型的中间层使用真实标签进行监督,以提升模型的性能。
为了评估这些方法的效果,研究者们设计了一系列实验,使用BabyPose数据集进行测试。BabyPose数据集包含了27个早产儿住院期间的深度摄像头视频,用于分析其肢体运动情况。实验结果显示,通过OKD和DS的结合,可以显著降低模型的计算成本,同时保持较高的性能水平。例如,在HRNet3-OKD-DS的配置下,学生模型HRNet2的参数量仅为HRNet4的27.5%,FLOPs(浮点运算次数)也仅为61.7%,而平均精度(AP)仅下降了0.59个百分点。这表明,通过优化模型结构和训练策略,可以在不牺牲性能的前提下,显著提升模型的效率。
#### 三、实验结果与分析
在实验中,研究者们评估了多种配置下的模型性能,包括传统监督训练(baseline)、OKD、MS-OKD和COKD等。实验结果显示,使用OKD和DS的模型在多个指标上均优于传统监督训练。例如,HRNet3-OKD-DS在AP、AR和PCK(Percentage of Correct Keypoints)指标上均优于HRNet3的基线模型。此外,HRNet4-OKD-DS在所有指标上均表现出最佳性能,表明教师模型(HRNet4)在OKD和DS的双重监督下,能够更有效地指导学生模型(HRNet3)的训练。
从计算效率的角度来看,HRNet2在所有实验中表现最为高效,其参数量和FLOPs仅为HRNet4的约1/3,而计算时间也明显缩短。然而,其性能仍略逊于HRNet4。这表明,在某些情况下,模型的复杂度与性能之间存在权衡关系,但通过优化训练策略,可以在一定程度上弥补这一差距。
此外,研究者们还评估了不同模型的能源消耗和碳排放情况。结果显示,HRNet2的碳排放量仅为HRNet4的约45%,这表明,通过降低模型的复杂度,可以显著减少其对环境的影响。这一发现对于推动绿色AI的发展具有重要意义,特别是在医疗资源有限的环境中,采用更高效的模型可以降低对能源的依赖,同时提高技术的可及性。
#### 四、讨论与意义
本研究的结果表明,结合OKD和DS的训练策略可以在保持模型性能的同时,显著降低其计算和能源消耗。这一方法为绿色AI在医疗领域的应用提供了可行的路径。通过减少模型的参数量和FLOPs,研究者们不仅降低了模型的运行成本,还减少了其对硬件设备的依赖,使得AI技术在资源受限的环境中更具可行性。
此外,本研究还探讨了模型预训练对性能的影响。结果显示,HRNet4在COCO数据集上预训练后,其在BabyPose数据集上的表现优于从头训练的模型。这表明,预训练在跨域任务中仍然具有重要的作用,尽管数据分布可能存在较大差异。然而,当使用HRNet3作为学生模型时,从头训练的效果优于预训练,这可能是因为HRNet3的结构更适合BabyPose数据集的特点。
在绿色AI的框架下,研究者们还探讨了不同训练策略对模型性能和效率的影响。例如,当HRNet4作为教师模型,同时指导HRNet3和HRNet2时,其性能和效率均优于单独使用OKD或DS的配置。这表明,多阶段的知识蒸馏和深度监督可以更有效地提升模型的性能,同时保持其计算效率。
#### 五、未来展望
本研究的成果为绿色AI在医疗领域的应用提供了新的思路。通过优化模型的训练策略,可以在不牺牲性能的前提下,显著降低其计算和能源消耗。这不仅有助于提升AI技术的可及性,还能够减少其对环境的影响,推动更加可持续的医疗技术发展。
未来的研究方向可能包括以下几个方面:首先,进一步探索不同训练策略对模型性能和效率的影响,以找到最优的平衡点;其次,研究如何在不同数据集和任务中应用这些技术,以提高模型的泛化能力;最后,探讨如何提升模型的可解释性,使其在医疗应用中更加可靠和可信。
综上所述,本研究通过结合知识蒸馏和深度监督,成功降低了HRNet模型的计算成本,同时保持了其性能。这一成果不仅有助于推动绿色AI的发展,还为医疗领域的AI应用提供了新的可能性。未来,随着技术的不断进步,绿色AI有望在更多领域发挥重要作用,为实现更加公平、可持续的医疗技术做出贡献。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号