综述：全关节置换术患者术中低体温风险预测模型的系统评价

《Journal of Multidisciplinary Healthcare》：Systematic Review of the Intraoperative Hypothermia Risk Prediction Models in Total Joint Arthroplasty Patients

【字体：大中小】 时间：2026年03月29日 来源：Journal of Multidisciplinary Healthcare 2.4

编辑推荐：

　　这是一篇针对全关节置换术（TJA）术中低体温（IH）风险预测模型的系统综述。文章旨在评估现有机器学习与逻辑回归模型的预测性能、开发质量与临床应用潜力。综述发现，相关模型表现出较好的校准与区分能力（AUC 0.791-0.938），并识别出一系列关键预测因子，如年龄、BMI、血红蛋白、ASA分级、手术时长、液体/冲洗量、失血量、室温及麻醉因素等。然而，受限于单中心、回顾性设计及验证方法不完善，多数研究存在较高的偏倚风险。未来需通过多中心前瞻性研究、标准化数据与验证流程，以及结合人工智能，来优化模型并推动其向可视化临床决策工具转化，从而有效指导围术期护理，降低IH发生率。

全关节置换术中低体温预测模型：现状、挑战与未来

引言

术中低体温（IH），即手术期间核心体温低于36°C，是全关节置换术（TJA）患者中一种常见的手术并发症，其发生率在10%至72.6%之间。它不仅普遍，更与不良预后相关，例如有研究指出，髋关节置换术患者若发生围手术期低体温，其30天死亡率会更高。因此，预防和管理低体温是提升围手术期护理安全与质量的关键环节。然而，目前临床上用于评估低体温风险的传统工具（如Predictors评分、瑞士分期模型等）存在预测能力有限、风险高估或对术中动态体温变化不敏感等不足。

在此背景下，机器学习（ML）等更先进的方法被引入临床风险预测领域。与传统的评分系统相比，ML能够更全面地识别IH的风险因素。尽管在全关节置换术这一IH高发人群中，相关预测模型已展现出潜力，但现有模型在数据来源、算法和质量上存在显著异质性。本综述旨在系统评价TJA患者IH风险预测模型，聚焦于其开发质量和预测性能，为临床转化提供循证依据。

材料与方法

本研究采用系统综述的方法。研究人员在PubMed、Embase、Cochrane Library、Web of Science、CINAHL、万方、中国知网（CNKI）、维普和SinoMed等九个数据库中进行了系统性检索，时间范围从建库至2025年10月。文献筛选和数据提取由两名经过循证护理培训的研究员独立完成，并采用预测模型研究偏倚风险评估工具（PROBAST）对纳入研究的质量进行评估。文献筛选流程遵循PRISMA指南，最终从240篇相关文章中筛选出8篇符合条件的研究纳入分析。

结果

纳入研究的基本特征

最终纳入的8项研究均开发了TJA患者术中低体温风险预测模型。其中，3项研究使用了列线图进行建模，4项研究进行了外部验证，4项研究使用风险公式计算预测因子，1项研究采用了决策树建模。此外，有4项研究为前瞻性队列研究。所有模型的开发样本量在60至512名参与者之间，结局事件发生率在27.00%至53.15%之间。

模型开发与关键预测因子

建模所使用的算法主要是逻辑回归（7项研究）和随机森林（1项研究）。所有模型均表现出良好的校准能力和较强的区分能力，其受试者工作特征曲线下面积（AUC）值在0.791至0.938之间。

通过对各项研究预测因子的整合分析，发现关键预测因子可分为三类：患者相关因素、手术相关因素和麻醉相关因素。模型纳入的预测因子数量在3到6个之间。最常见的预测因子是年龄（5项研究）。在患者相关因素中，年龄和体重指数（BMI） 的纳入比例分别为62.5%和37.5%。手术相关因素的纳入比例分别为：术中液体量（37.5%）、手术时长（25%）、术中失血量（37.5%）、手术室温度（25%）、术中冲洗量（25%）以及是否使用主动保温（25%）。麻醉相关因素包括：麻醉时长（37.5%）和美国麻醉医师协会（ASA）分级（25%）。

模型验证与性能

所有8项研究均进行了内部验证，其中5项研究使用了Hosmer-Lemeshow拟合优度检验，结果P>0.05，表明模型校准良好。有4项研究进行了外部验证。7项研究报告了模型的敏感性和特异性，表明模型具有良好的诊断能力。

纳入研究的质量评估结果

使用PROBAST工具进行的质量评估表明，7项研究的总体偏倚风险较高。在参与者领域，4项为回顾性研究，可能存在数据缺失和已知疾病结局的问题，导致该领域存在高偏倚风险。在统计分析领域，3项研究直接删除了缺失数据而未说明处理方法，3项研究仅使用随机拆分进行内部验证，另有3项研究未明确内部验证方法，这些都可能影响模型性能评估的全面性，并增加过拟合风险。在适用性方面，一项研究因纳入了其他类型的关节置换术患者而被评为高关注度，其余7项研究总体显示低风险适用性。

讨论

关节置换术患者低温风险预测工具的高偏倚风险与适用性分析

本综述纳入的模型在参与者领域和数据分析领域均显示出较高的偏倚风险。原因主要包括：1）参与者领域：回顾性研究设计占一半，使用历史临床数据构建模型可能导致数据质量不完整；2）统计分析领域：部分研究直接删除缺失数据，且内部验证方法不完善（如仅随机拆分或未明确方法），外部验证不足（仅50%的研究进行），限制了模型的泛化能力；3）适用性评估：核心体温监测方法不一致（鼓膜、鼻咽、红外额温等），其中红外额温监测并非指南推荐方法，可能导致数据偏差。

未来研究应注重提升工具的科学研究严谨性和标准化。在开发风险预测模型时，不仅应考虑样本量，还应优先考虑多中心数据的应用以提高模型的普适性。对于缺失数据，应使用单一或多重插补法进行处理。此外，在选择预测因子时应纳入专家意见或共识。模型的内部和外部验证应得到加强，利用独立数据集进行外部验证，以多维度评估模型性能。

关节置换术患者低温风险预测模型的改进需求

建模方法单一且有限

纳入的8个风险预测模型中，7个使用传统的Logistic回归构建，仅1项使用了机器学习方法。虽然随机森林模型在捕捉非线性关系方面有优势，且其AUC也大于0.8，但由于未进行外部验证，其泛化能力尚未得到证实。未来的研究应确保在使用机器学习方法拟合内部数据后，在不同中心和人群中进行泛化性验证。

研究设计与数据质量差异

纳入的研究中，回顾性与前瞻性研究各半。所有研究均为单中心，受人群和环境限制，其普遍性有限。部分研究对缺失数据的处理仅为直接删除，可能引入偏倚。未来的研究应采用插补或填补方法来标准化处理缺失数据。

验证方法的差异与完整性

尽管部分研究进行了外部验证且显示出良好的稳定性，但仍有研究外部验证的样本量小、准确性有待提高。分析外部验证的比例表明，预测模型的验证过程仍有改进空间。对预测模型进行全面验证可以增强其优势，提高研究质量。

核心体温监测方法的差异

术中体温监测应是连续和动态的。目前推荐的、最实用的核心体温监测方法是食管或鼻咽温度测量。但一项研究使用了红外额温监测，这可能导致温度监测结果存在偏差，并可能影响模型性能。

预测因子选择的差异

综合各研究的最终预测因子，年龄、BMI、术中液体量、麻醉时间、术中失血量和血红蛋白是最常使用的预测因子。然而，模型中包含的预测因子数量和类型存在差异，一些模型未包含高度相关的预测因子。这种对关键预测因子覆盖的缺乏可能会影响模型预测的准确性。

目前，针对关节置换术患者的低温风险预测模型仍处于早期阶段。未来的研究应侧重于标准化模型的开发和验证，构建大规模的多中心模型，并设计符合PROBAST标准的研究，为临床实践提供更适用的预测工具。

单中心研究在预测全关节置换术患者低体温风险方面的局限性

当前关于TJA患者低体温风险预测模型的研究主要在中国进行，且大多采用单中心设计。这导致模型在普适性、代表性和临床适用性方面存在显著局限，可从四个角度分析：

1.
医疗体系差异：中国与欧美在体温监测频率、术中管理协议等方面存在差异。例如，研究中定义的“术中液体量>1500mL”为高风险阈值，可能与欧美2000mL的标准不同，直接应用可能导致风险评估错误。
2.
人群特征差异：模型均基于中国人群构建，其平均BMI、血红蛋白阈值等生理指标与西方人群存在差异。例如，中国研究中BMI<18.5 kg/m²为高风险，而西方研究可能以BMI<22 kg/m²为标准。这些生理和用药差异限制了模型的跨人群适用性。
3.
研究设计局限：单中心设计本身存在选择偏倚、环境干扰和数据同质性的风险，削弱了模型的稳定性和外部效度。例如，部分研究仅纳入ASA I-II级患者，可能降低模型对危重患者的风险预测能力。
4.
临床实践异质性：模型基于中国的临床实践开发，其手术技术、设备配置和护理流程与其他地区存在显著差异。例如，美国日间关节置换手术比例较高，依赖于协调的手术操作和整合的术后监测，而这在中国尚未广泛实施，进一步限制了模型的临床适用性。

鉴于中国与西方人群在BMI和血红蛋白阈值等生理指标上的差异，这些模型在跨区域应用前需要进行本地化重新校准。未能考虑这些人群特异性变量可能导致在不同临床环境中的护理干预措施不当，并损害患者安全。

全关节置换术患者低体温风险预测模型的未来方向

预防和管理低体温是提高围手术期护理安全性和质量的关键。除了体温监测和各种保温措施外，筛查高风险个体的影响因素、建立术前低体温评估以及开发合适的风险预测模型来指导临床评估至关重要。

模型优化方向

•
推动多中心数据共享与协作：所有纳入研究均为单中心研究。未来应由顶尖护理团队牵头，与不同地区、不同级别的医院合作，建立TJA患者低体温风险预测的共享数据库。例如，已有研究提出利用移动应用程序，通过超过30家医院的多中心、前瞻性、观察性队列研究来计算围手术期低体温风险评分，这有助于提高数据标准化水平，从而更好地进行模型优化。
•
人工智能引领：近年来，随着人工智能（AI）技术的发展，机器学习（ML）已越来越多地应用于临床研究。术中低体温的发生与手术时长、麻醉方式、年龄相关的体温调节能力下降等多种因素复杂相关。ML在处理多维度和非线性关系方面具有巨大潜力。与传统的统计方法相比，ML能自动识别变量间的潜在关系，构建更准确、高效的模型，以满足临床需求。因此，未来的临床护理研究应紧密结合大数据和AI技术，探索使用其他机器学习方法来构建模型。

结论

本研究表明，尽管针对TJA患者的IH风险预测模型显示出良好的性能和应用前景，但现有研究普遍存在较高的偏倚风险，模型发展仍处于初期阶段。为弥补模型开发与临床应用之间的差距，未来的研究必须优先考虑使用大规模、多中心数据集进行严格的外部验证，以降低过拟合风险。此外，将这些经过验证的算法转化为可视化的、床旁临床决策支持工具，对于将预测性见解转化为改善的体温调节结果和提升TJA患者安全至关重要。未来的护理工作应聚焦于“模型优化-临床转化-科学宣教”三位一体。通过多中心协作与标准化应用，提升模型质量，加强内外部验证以增强普适性，并将模型转化为临床实践，从而降低低体温发生率，改善患者预后，提升患者满意度。

热点排行