《BUILDING AND ENVIRONMENT》:AI-based Personal Conditioning with Physiological Awareness: Fine-tuned Small and Large Language Models vs. Neural Networks
编辑推荐:
本研究针对当前个性化环境调节依赖人工调整、难以适应动态环境的问题,开展了基于AI的生理感知个性化环境调节研究。研究人员通过微调小语言模型(SLM)和大语言模型(LLM),并与神经网络(NN)对比,利用包含10万条多模态数据的数据集,实现了从实时生理测量中准确预测用户热舒适度。结果显示,微调后的SLM和LLM性能显著提升(F1分数最高达0.99),HRV特征明显优于温度特征,多模态特征实现近乎完美性能。该研究为未来以人为本的个性化环境调节提供了明确的模型选择指南,对提升用户满意度和能效优化具有重要意义。
在现代建筑环境中,维持舒适的热环境对 occupants( occupants)的健康、满意度和 productivity( productivity)至关重要。然而,传统的集中式HVAC(Heating, Ventilation, and Air Conditioning, 供暖、通风与空调)系统难以满足个体化的热舒适需求,常常导致能源浪费。近年来,personal conditioning(个性化环境调节)作为一种有前景的解决方案应运而生,它通过在使用者周围创造微环境来满足个体需求。但现有的个性化环境调节设备大多依赖手动控制,其响应动态环境变化的能力有限。因此,赋予这些系统 physiological awareness(生理感知)能力,使其能够基于使用者的实时生理数据准确预测热舒适度,从而实现自主调节,成为了一个重要的研究方向。
传统的热舒适模型,如预测平均投票/预测不满意百分比(PMV/PPD)模型和适应性热舒适模型,在应用于动态或非均匀环境时存在局限性,且难以捕捉个体的差异化偏好。尽管各种机器学习(ML)方法已被用于热舒适建模,但它们通常需要复杂的特征工程,且模型的可转移性和用户友好性不足。近年来,大语言模型(LLM)因其在多种任务上的卓越表现和自然的语言交互界面而受到广泛关注。然而,LLM庞大的规模也带来了计算资源消耗大、部署成本高的问题。与此同时,小语言模型(SLM)以其参数少、成本低、适合在消费级设备上部署的特点,显示出在特定任务中的应用潜力。特别值得注意的是,先前的研究尚未探索将SLM或LLM应用于具有生理感知的AI驱动的个性化环境调节中,且预训练模型本身缺乏该领域的特定知识。
为了填补这一研究空白,来自马里兰大学帕克分校机械工程系的Lingzhe Wang、Gautam Vanama和Jelena Srebric教授在《BUILDING AND ENVIRONMENT》上发表了一项研究,题为“AI-based Personal Conditioning with Physiological Awareness: Fine-tuned Small and Large Language Models vs. Neural Networks”。该研究首次系统性地探讨了微调后的SLM (Qwen 2.5 1.5B Instruct) 和LLM (Qwen 2.5 14B Instruct) 与神经网络(NN)在基于生理感知的个性化环境调节中的性能对比。
关键技术方法
研究基于先前人体实验(IRB 1973659)收集的多模态数据集(约10万条数据),该数据集包含了在不同室内空气温度(22°C, 25°C, 28°C)下,使用个性化环境调节设备(送风速率4L/s,风速8m/s)创造的不同热舒适水平下的环境、生理(包括面部皮肤温度、心率变异性(HRV)指标如SDNN、SDSD、RMSSD、pNN20、pNN50、LF/HF等)和系统运行数据,以及受试者报告的整体与局部(面部)热感觉(TS)和热舒适(TC)。研究人员定义了三种特征组:基于温度的低维特征组(FG1)、基于HRV的中维特征组(FG2)和包含所有特征的多模态高维特征组(FG3)。研究比较了NN、微调SLM和微调LLM在不同特征组下预测四种输出(整体TS、整体TC、局部TS、局部TC)的性能,并使用加权F1分数和混淆矩阵进行评估。对SLM和LLM的微调采用了低秩自适应(LoRA)技术以提升效率。
研究结果
1. 预训练模型性能与微调必要性
所有预训练的SLM和LLM在热舒适预测任务上均表现不佳(F1分数接近0),这表明预训练模型本身缺乏该领域的专业知识,存在冷启动问题。微调过程则使模型性能得到了显著提升。
2. 不同特征组下的模型性能
- •
温度低维特征(FG1): 所有模型的性能均相对较低(NN最高达0.45,SLM 0.42,LLM 0.43)。在此情况下,简单的NN架构表现最佳或与语言模型相当,说明对于低维数据,复杂模型的优势无法发挥。
- •
HRV中维特征(FG2): 引入HRV特征后,所有模型性能均显著提升(NN: 0.73, SLM: 0.93, LLM: 0.96)。微调后的SLM和LLM性能明显优于NN,表明HRV特征能提供更丰富的生理信息,且语言模型能更好地捕捉其中的复杂模式。
- •
多模态高维特征(FG3): 结合了温度、HRV、心率及系统运行状态等多维度特征后,模型达到了最佳性能。NN性能进一步提升(0.91),而微调后的SLM和LLM则实现了近乎完美的预测准确率(F1分数达0.98-0.99),且两者性能差异极小。
3. 混淆矩阵分析
混淆矩阵分析进一步证实了上述趋势。在低维特征下,模型预测倾向于集中在少数类别;随着特征维度增加,特别是使用多模态特征后,微调SLM和LLM的预测结果几乎完全集中在对角线(正确分类),显示出极强的分类能力。
4. 过拟合考察
通过比较训练损失和测试损失,研究发现模型没有出现明显的过拟合现象,支持了性能评估结果的可靠性。
5. 实际应用考量:性能与成本权衡
研究深入分析了模型在实际部署中的计算成本、能耗和硬件需求。
- •
训练成本: NN训练成本可忽略不计,SLM微调能耗适中(~0.24 kWh,使用消费级GPU),LLM微调能耗最高(~1.66 kWh,需企业级GPU)。
- •
推理成本: 这是部署的关键。NN的年推理能耗极低(~10-10kWh),可轻松部署在IoT设备上。SLM的年推理能耗约为0.1 kWh,可在仅使用CPU的系统上运行(内存占用4-6GB)。LLM的年推理能耗则高达7.9 kWh,通常需要GPU支持以实现实用推理速度。
- •
性能-成本权衡: 研究明确指出了模型选择需权衡性能与成本。对于低维数据,NN是最佳选择。对于中高维数据,若性能要求不高,NN是经济高效的选择;若追求高性能,则微调SLM是理想方案,因其能以远低于LLM的成本达到与LLM相媲美的性能。
研究结论与意义
本研究首次证明了微调SLM和LLM对于实现具有生理感知的AI驱动个性化环境调节的必要性和有效性。预训练模型缺乏领域知识,而微调能使其性能产生质的飞跃。研究系统性地分析了特征维度和模型复杂度之间的相互作用,揭示了HRV等多模态生理特征相较于传统温度特征的显著优势。
最重要的是,该研究为模型选择提供了清晰的实践指南:在处理低维特征时,应优先选择NN;面对中高维数据时,需在性能和成本之间进行权衡,NN适用于成本敏感、性能要求适中的场景,而微调SLM则是实现高性能、同时控制成本的优选方案。这些发现为未来构建可扩展、高能效、以人为本的个性化环境调节系统奠定了坚实基础。通过将实时生理测量与高效的AI模型相结合,未来的个性化环境系统能够自主、精准地适应使用者的舒适度需求,不仅提升用户体验,还有望通过与集中式HVAC系统协同优化,显著降低建筑整体能耗。
研究的讨论部分还就伦理考量(如数据隐私)、研究局限性(如实验条件、参与者多样性)以及未来研究方向(如模型可解释性、在线学习、长期性能稳定性、与更广泛建筑环境控制策略的集成)进行了阐述,为后续研究指明了方向。