数据驱动的人类能量消耗预测:个性化模型与基于人群的模型的对比

《Biomedical Signal Processing and Control》:Data-driven Human Energy Expenditure Prediction: Contrasting Personalized and Population-Based Models

【字体: 时间:2025年11月22日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  人体能量消耗(EE)预测的个性化与通用模型比较研究。通过23名受试者的多传感器数据(皮肤温度、热流、加速度、心率),采用随机森林算法构建7种输入组合的个性化模型和通用模型。结果显示,个性化模型MAPE最低达2%,但传感器位置和数量对其敏感;通用模型MAPE为16.5%-28%,更具鲁棒性。最优传感器位于右小腿,加速度数据对男性预测更优,而皮肤温度对女性更关键。研究表明,融合运动、热力学和心血管数据可提升预测精度,但需平衡个性化需求与设备实用性。

  人类的能量消耗(Energy Expenditure, EE)是衡量身体活动强度和代谢水平的重要指标,其个体间的差异性以及受到食物热效应和体力活动的影响,使得精确预测EE成为研究健康、运动表现、环境控制和个性化舒适度模型的关键挑战。近年来,随着可穿戴传感器和机器学习技术的进步,EE预测的准确性显著提升。然而,大多数研究仍依赖于群体层面的模型,而个性化模型则展现出更高的预测精度,但同时也面临着如何在传感器实用性与测量精度之间取得平衡的问题。本文探讨了在办公环境中常见的低至中等强度活动下的通用与个性化EE预测方法,并且是目前在该领域最为全面的研究。通过分析23名参与者(12名女性,11名男性)的数据,我们使用随机森林(Random Forest, RF)算法构建了针对个人的模型和群体模型,评估了4种生物标志物(皮肤温度、热通量、加速度计数据、心率)在1至16个身体部位上的组合效果,总共生成了3094个定制模型。研究结果表明,当将基于运动、热学和心血管数据结合时,个性化EE预测的精度达到最高。虽然加速度计单独使用在男性中表现良好,但加入生理信号,特别是皮肤温度,可以显著提高女性的预测精度。下肢加速度计,尤其是小腿部位,显示出更高的可靠性。总体而言,个性化模型在精度上优于通用模型(2%的平均绝对百分比误差,MAPE),但对传感器位置和数据可用性更为敏感,而通用模型虽然精度较低(16.5%–28% MAPE),但其鲁棒性更强,适合广泛的应用场景。这些发现强调了在个性化EE建模中,精心选择传感器策略的重要性,并突出了整合受试者特定校准的混合建模方法在平衡精度和鲁棒性方面的作用。

在办公环境中,人类的能量消耗模式通常与久坐、站立和轻度步行活动相关,这些活动的EE变化幅度较大,尤其是在行走时,EE会显著增加。因此,理解这些动态变化对于制定个性化的健康管理策略至关重要。在本文的研究中,EE被分为三个主要组成部分:基础代谢率(BMR)、食物热效应(TEF)和体力活动相关的能量消耗(PAEE)。BMR是人体在完全休息状态下的能量消耗,对于久坐人群,BMR占每日总能量消耗(TDEE)的约60%。TEF代表了消化、吸收和储存食物所需的能量,通常占TDEE的10%–15%。而PAEE则是最具波动性的部分,根据个体的活动水平,其占比可以从久坐人群的约15%增加到高度活跃人群的超过50%。因此,考虑时间维度对于理解这些个体特定的动态组成部分至关重要。

EE的测量方法在过去几十年中经历了显著的发展。传统的EE测量方法是间接测热法(Indirect Calorimetry, IC),它通过分析氧气消耗和二氧化碳产生来评估能量消耗。然而,这种方法因其侵入性和高昂的成本,难以在实际应用中广泛使用。因此,预测方程成为一种替代方案,但它们的精度通常有限。近年来,可穿戴设备的出现为EE的测量提供了新的可能性,从简单的计步器发展到复杂的健康监测系统。这些设备通常可以测量多种生物信号,包括皮肤温度、热通量、加速度计数据和心率等,从而提供更全面的EE预测。然而,尽管这些技术取得了进步,实现真正的个性化EE估计仍然面临挑战。

在本文的研究中,我们对23名参与者进行了实验,这些参与者在特定的环境条件下进行了一系列活动,包括久坐工作、站立工作和以2公里/小时的速度行走。这些活动被选择为典型的工作任务,以确保数据的多样性。参与者被要求在实验当天保持一致的作息和饮食,以减少外部因素对EE测量的影响。实验中使用的传感器包括CALERA,这是一种轻巧且紧凑的可穿戴设备,可以测量皮肤温度、热通量和加速度计数据。这些传感器被放置在16个不同的身体部位,以评估不同位置对EE预测的影响。

为了提高EE预测的准确性,研究团队采用了随机森林算法,这是一种在处理高维数据和复杂数据结构方面表现出色的机器学习方法。该算法在处理各种样本量和特征空间时具有较高的效率,并且在有限的计算资源下可以有效防止过拟合。通过随机搜索方法和交叉验证,我们对模型的超参数进行了优化,以提高预测性能。研究还探讨了不同输入参数组合对EE预测的影响,包括单独使用皮肤温度、热通量或加速度计数据,以及将这些参数组合在一起的效果。结果显示,虽然单独使用某些参数(如加速度计)可以提供良好的预测效果,但将多种参数结合使用可以进一步提高预测精度,尤其是在女性参与者中,皮肤温度的加入显著提升了模型的准确性。

此外,研究还分析了不同数据分割策略对模型性能的影响。例如,将数据按活动类型分割(如久坐、站立、行走)和按实验时间段分割(如上午和下午)。按活动类型分割的方法在模型性能上表现更优,因为这种方法能够减少数据集内的个体间差异,从而提高模型的稳定性。而按时间段分割的方法则引入了更大的EE波动,使得模型难以学习稳定的模式。这些发现强调了在构建EE预测模型时,选择合适的分割策略对于提高预测精度的重要性。

研究还探讨了不同传感器位置对EE预测的影响。结果显示,下肢传感器,尤其是小腿部位,对于EE预测最为可靠。这可能是由于下肢在行走和站立活动中的重要作用,能够更准确地反映运动模式和能量消耗。相比之下,手腕和髋部传感器在捕捉下肢活动方面存在局限,因此在预测EE时可能不够准确。因此,传感器的放置位置对于模型性能具有显著影响,需要根据具体的活动类型和个体特征进行优化。

研究团队还使用了SHAP分析来评估模型的可解释性,识别出对EE预测影响最大的特征。结果表明,不同个体对同一特征的依赖性存在差异,例如,某些个体可能更依赖心率数据,而另一些个体则可能更依赖皮肤温度或热通量数据。这种个体间的差异性进一步支持了个性化建模的必要性,因为通用模型可能无法准确捕捉所有个体的生理特征和行为模式。

在模型的超参数分析中,研究发现不同建模策略下的参数配置存在显著差异。例如,某些个体的模型可能需要更多的树(n_estimators)和更深的决策树(max_depth)来达到最佳性能,而另一些个体的模型则可能在更简单的参数配置下表现出色。这些发现表明,个性化建模需要根据个体的特征和数据的特性进行灵活调整,以实现最佳的预测效果。

研究还发现,EE预测的精度在不同建模策略中存在显著差异。例如,通用模型的平均绝对百分比误差(MAPE)在16.5%–28%之间,而个性化模型的MAPE则显著降低,达到2%。这种精度的差异主要是由于通用模型在预测时忽略了个体间的差异性,而个性化模型则能够更精确地捕捉个体的生理特征和行为模式。然而,个性化模型对传感器位置和数据可用性更为敏感,这意味着在实际应用中需要更加谨慎地选择传感器位置和数据采集方式。

为了平衡精度和鲁棒性,研究团队建议采用混合建模方法,即在通用模型的基础上,通过个体特定的校准来提高预测精度。这种方法可以在不牺牲模型的通用性的同时,为特定个体提供更精确的预测。此外,研究还指出,未来的EE预测研究应进一步探索更先进的深度学习算法,以优化传感策略并提高模型的精度和鲁棒性。

综上所述,本文的研究结果表明,个性化EE预测在精度上优于通用模型,但需要在传感器选择和数据采集策略上进行精心设计,以确保模型的鲁棒性和实用性。此外,研究还强调了混合建模方法在平衡精度和鲁棒性方面的重要性,以及在实际应用中需要考虑个体差异和环境因素对EE的影响。这些发现为未来的EE预测研究和应用提供了重要的指导,尤其是在办公环境等低至中等强度活动的场景中。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号