编辑推荐:
随着全球人口老龄化,非心脏手术需求增加,但老年患者手术风险高。研究人员基于 MIMIC 数据库开展老年非心脏手术患者 30 天死亡风险预测模型研究。结果显示 CatBoost 模型性能最佳,能辅助临床决策,意义重大。
在人口老龄化加速的当下,老年群体规模不断扩大。这使得医疗领域面临诸多新挑战,其中老年患者的手术风险评估成为关键问题。在外科手术中,非心脏手术占比高达约 85% 。然而,老年患者身体机能衰退,合并多种基础疾病,导致非心脏手术风险剧增。据统计,接受非心脏手术的患者中,约 8% 需要进入重症监护病房(ICU),住院死亡率在 1.2 - 21.5% 之间。
传统的手术风险评估工具,如修订心脏风险指数(RCRI)、美国外科医师学会 - 国家外科质量改进计划的心肌梗死或心脏骤停风险计算器(ACS - NSQIP - MICA)等,大多是为心脏手术设计的,并不适用于非心脏手术。而像手术结局风险工具(SORT)缺乏外部验证,手术 Apgar 评分预测效果不佳,生理和手术应激评分(POSSUM)因数据复杂且需手动处理而应用不便。这些传统工具的局限性,迫切需要新的评估方法来填补空白,提高风险评估的准确性和全面性,为临床决策提供更可靠的依据。
在此背景下,辽宁省人民医院、锦州医科大学指挥研究生培训基地等机构的研究人员展开了深入研究。他们旨在开发一种基于机器学习的模型,利用术前病史和各种检查指标,预测老年患者非心脏手术后的死亡风险。该研究成果发表在《European Journal of Medical Research》上,为临床实践、学术研究和保障患者安全提供了重要参考。
研究人员主要采用了以下关键技术方法:首先,数据来源于 MIMIC - III 和 MIMIC - IV 数据库,这些数据库涵盖了大量 ICU 患者病例。接着,运用软件工具管理和组织数据,通过 SQL 查询提取临床信息。在数据处理阶段,采用多种方法,如排除异常值、多重插补处理缺失数据、利用 LASSO 正则化和极端梯度提升(XGBoost)进行特征选择等。之后,使用合成少数过采样技术(SMOTE)处理数据不平衡问题,并将数据按 7:3 比例划分为训练集和测试集。最后,训练并比较逻辑回归(LR)、决策树(DT)、随机森林(RF)、支持向量机(SVM)和 CatBoost 这五种机器学习模型 。
研究结果
- 基线特征:从 MIMIC - IV 数据库筛选出 1960 名参与者,平均年龄 76.33±7.60 岁,女性占 53.1%,高血压最为常见,占 52.0%,手术患者死亡率为 11.4%。年龄、白细胞计数、首日 RCRI 评分等多个变量在幸存者和非幸存者间存在显著差异(p<0.001)。
- 模型性能:在测试集中,CatBoost 模型表现最佳,AUC 达到 0.96,F1 值为 0.90。在 MIMIC - III 数据库的外部验证中,其 AUC 高达 0.98,优于其他模型。同时,CatBoost 模型的校准曲线斜率为 0.0443,拟合度更好,验证损失最低,泛化性能最优。相比之下,传统 RCRI 评分计算的 AUC 仅 0.78,凸显了 CatBoost 模型的优势。
- 模型解释:通过 SHAP 分析发现,阴离子间隙、年龄、凝血酶原时间(PT)和体重是影响 CatBoost 模型预测的关键变量。阴离子间隙高于 20 mmol/L、年龄大于 80 岁、PT 超过 20 s 与死亡风险增加相关,而体重增加则对生存预测有负面影响。
- 模型应用:基于 CatBoost 算法开发了在线网络计算器,临床医生输入患者相关数据即可获得预测结果,辅助临床决策,优化医疗资源分配。
研究结论与讨论
本研究成功构建了预测老年非心脏手术患者 30 天死亡率的机器学习模型,CatBoost 模型性能卓越,优于传统风险评估工具,并通过外部数据集进行了验证。开发的网络计算器提高了模型实用性,有助于临床医生术前评估患者风险,优化医疗资源配置,改善患者预后。
然而,研究也存在一定局限性。数据集中患者年龄为 65 - 89 岁,限制了研究结果对其他年龄组的适用性;排除缺失值超 30% 的数据可能引入选择偏倚;模型仅基于首次 ICU 入院数据,缺乏动态信息;数据来源于特定 ICU 人群,普适性受限;模型依赖 Python 软件,对不熟悉该编程环境的临床医生存在使用障碍;样本量对于某些亚组分析可能不足。
尽管如此,该研究仍为老年非心脏手术患者风险预测提供了新方向。未来研究可扩大年龄范围、纳入多中心多样本数据、整合纵向数据,进一步优化模型,提高其稳健性和适用性,为临床实践提供更精准、有效的风险评估工具,助力改善老年患者手术预后和生活质量 。