编辑推荐:
髋部骨折在老年人中愈发常见,其术前急性心力衰竭(AHF)风险评估常被忽视。研究人员利用机器学习和 SHAP 分析,对 2631 例患者研究,构建预测模型。结果显示 GBM 模型表现最佳,该研究为临床诊疗提供有力支持。
随着全球老龄化进程的加速,髋部骨折已成为老年人面临的一个重大健康挑战。据统计,自 1990 年有记录以来,全球已有超过 160 万人遭受髋部骨折,预计到 2050 年,这一数字将至少上升至 450 万。髋部骨折不仅会大幅增加患者的死亡率和残疾率,严重影响生活质量,还会给医疗系统带来沉重负担,包括手术治疗费用、长期康复费用以及后续的社会经济负担 。
在这一背景下,老年人髋部骨折术前急性心力衰竭(AHF)的风险问题尤为突出。AHF 是指心脏突然无法有效地泵血,导致身体循环血量不足以满足代谢需求的一种病症。在临床实践中,多数外科医生在对老年人髋部骨折进行术前评估时,常常忽略对心力衰竭生物标志物,如脑钠肽(Brain Natriuretic Peptide,BNP)或 N 末端 B 型利钠肽原(N-Terminal pro-B-Type Natriuretic Peptide,NT-proBNP)的检测。这一疏忽可能导致无法及时发现已发生 AHF 的患者,错过最佳干预时机,进而增加手术风险、延长住院时间,并可能引发感染、再骨折等术后并发症,严重时甚至会导致患者死亡。因此,如何准确预测老年人髋部骨折术前 AHF 的风险,成为改善这一患者群体治疗效果的关键。
为了解决这一问题,河北医科大学第三医院的研究人员开展了一项回顾性队列研究。研究旨在通过机器学习技术和 SHapley Additive exPlanations(SHAP)分析,精准预测老年人髋部骨折术前 AHF 的风险,为临床医生优化患者管理策略、减少不良事件提供科学依据。
研究人员选取了 2018 年 1 月至 2022 年 12 月在河北医科大学第三医院老年骨科接受髋部手术的患者作为研究对象。在研究过程中,主要运用了以下关键技术方法:
- 数据收集:从医院病历系统收集患者术前数据,涵盖心力衰竭状态、性别、年龄、合并症等多方面信息1。
- 模型建立:运用逻辑回归、随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)等多种机器学习算法构建预测模型。其中,逻辑回归模型通过向后消除法(Backward Elimination)进行变量选择,以避免过拟合;其他机器学习模型则使用相同的变量集进行训练,并采用 5 折交叉验证评估性能23。
- 模型评估与解释:通过计算受试者工作特征曲线下面积(Area Under the Curve,AUC)、Hosmer-Lemeshow 检验、决策曲线分析(Decision Curve Analysis,DCA)和临床影响曲线(Clinical Impact Curve,CIC)等对模型进行综合评估;利用 SHAP 分析揭示不同变量对模型预测的贡献及变量间的相互作用4。
研究结果如下:
- 患者基线特征:最初纳入 4170 例老年人髋部骨折患者,经筛选排除 1539 例,最终 2631 例患者纳入分析。患者平均年龄 79.3±7.7 岁,其中 33.7% 的患者术前发生 AHF。AHF 组与非 AHF 组在性别、年龄、合并症及术前并发症等方面存在显著差异56。
- 单因素分析:实验室数据和超声检查的单因素分析显示,AHF 组贫血、低钾血症、低钠血症和低白蛋白血症的发生率显著高于非 AHF 组,而两组下肢静脉血栓形成的发生率无显著差异7。
- 模型构建与验证:通过多变量逻辑回归分析,确定了性别、年龄、冠心病、肺部感染、室性心律失常、急性心肌梗死、贫血、低钾血症和低白蛋白血症为老年人髋部骨折术前 AHF 发生的独立危险因素,并据此构建了列线图模型(nomogram model)。该模型的 AUC 为 0.767(0.723 - 0.799),校准曲线显示模型预测与实际观察吻合良好。此外,研究还构建了 5 种机器学习模型,其中梯度提升机(Gradient Boosting Machine,GBM)表现最佳,AUC 为 0.757(0.721 - 0.792),在准确率、灵敏度、精度和 F1 评分等指标上也具有优势89。
- SHAP 分析:SHAP 分析表明,急性心肌梗死是影响 AHF 风险预测的最关键因素,其存在显著增加 AHF 风险;同时还揭示了变量间的相互作用,如急性心肌梗死与贫血、肺部感染与贫血等之间存在协同影响 AHF 风险的关系1011。
研究结论和讨论部分指出,本研究成功构建了基于机器学习的老年人髋部骨折术前 AHF 风险预测模型,GBM 模型在各项评估指标中表现出色。SHAP 分析增强了模型的可解释性,帮助临床医生清晰了解各因素对 AHF 风险的影响及变量间的相互作用。这一研究成果为临床医生识别高风险患者、制定针对性的预防和治疗措施提供了有力工具,有助于优化术前管理,改善患者预后,对提高老年人髋部骨折的临床治疗效果具有重要意义。
然而,该研究也存在一定局限性。样本仅来源于特定医院,可能限制研究结果的普遍适用性;回顾性研究可能存在样本选择偏倚;机器学习模型的可解释性虽通过 SHAP 分析有所增强,但仍存在 “黑箱” 问题;模型可能遗漏重要预测变量;研究仅进行了内部验证,缺乏外部验证。尽管如此,本研究为心力衰竭和骨科研究领域提供了新的思路和方法,展示了大数据时代对医学科学发展的推动作用,有望为后续研究和临床实践提供重要参考。