编辑推荐:
为解决临床难以准确评估老年急诊手术患者术后风险及现有风险预测工具的不足,研究人员开展了基于 EHR 数据开发和验证老年急诊手术风险分层工具(AGES 评分)的研究。结果显示该模型能准确预测术后并发症风险,有助于临床决策,意义重大。
在人口老龄化加剧的当下,医疗领域面临着诸多新挑战。就外科手术而言,每年美国有超三百万患者因紧急或急诊手术入院,其中老年患者占比不小。老年群体本身合并症多、身体较为虚弱,这使得他们在接受紧急或急诊手术后,出现不良预后的风险显著增加。比如,术后可能发生心脏骤停、心肌梗死、肺栓塞等严重并发症,甚至导致死亡,这些情况严重威胁着老年患者的生命健康 。
然而,当前临床在判断这类患者手术风险时,状况并不乐观。虽然存在多种预测老年患者手术不良结局的评分系统,但它们都有着明显的缺陷。像临床衰弱量表,其评估组件难以从电子健康记录(EHR)中自动获取;美国麻醉医师协会身体状况分类系统主观性强,不同使用者之间可靠性差异大;美国外科医师学会国家手术质量改进计划手术风险计算器等,在老年人群中的预测表现也不尽如人意,并且这些评分大多只能预测单一结局,无法满足临床全面评估的需求 。鉴于此,开发一款能有效整合 EHR 数据、精准预测老年急诊手术患者术后风险的工具迫在眉睫。
为攻克这一难题,来自 Kaiser Permanente Northern California(KPNC)等机构的研究人员展开了深入研究。他们的目标是开发并验证一种名为老年急诊手术评估(Assessment of Geriatric Emergency Surgery,AGES)评分的风险分层工具,利用术前已有的 EHR 数据,预测老年患者术后 30 天内发生严重并发症和死亡的风险 。
研究人员通过回顾性队列研究的方式展开此项工作。研究对象为 2017 年 1 月 1 日至 2021 年 12 月 31 日期间,在 KPNC 旗下 21 家医院中,年龄 65 岁及以上接受紧急或急诊非心脏手术的患者 。为确保研究数据的准确性和可靠性,他们制定了严格的纳入和排除标准。比如,排除了手术例数过少的专科手术、器官移植手术、创伤手术等 。
在研究过程中,他们确定了 76 个预测因子,包括患者的年龄、性别、身体质量指数(BMI)、合并症评分(COPS2)、实验室急性生理学评分(LAPS)等,这些预测因子涵盖了患者的基本信息、疾病状况以及生理指标等多个方面 。同时,研究人员构建了多种模型,如逻辑回归、LASSO 回归、决策树、随机森林和 XGBoost 模型,通过对比这些模型的性能,来确定最佳预测模型 。
最终,研究取得了一系列重要成果。在预测术后 30 天主要并发症和死亡率这一复合结局方面,XGBoost 模型表现最为出色,其受试者工作特征曲线下面积(AUCROC)达到 0.804 。在预测术后败血症、进行性肾功能不全或肾衰竭、死亡率等单个临床结局时,XGBoost 模型同样展现出了强大的预测能力,AUCROC 分别为 0.823、0.781 和 0.839 。此外,该模型在不同种族、性别以及不同外科服务组中都表现出了稳定的预测准确性 。
这一研究成果意义非凡。AGES 评分模型能够精准预测老年急诊手术患者的术后风险,为临床医生提供了重要的决策依据。在术前,医生可以根据该模型评估患者风险,与患者及其家属充分沟通,制定更为合理的手术方案和围手术期管理策略。比如,对于高风险患者,医生可以提前做好更充分的准备,采取更严密的监测措施,从而降低患者术后并发症的发生率,提高手术成功率和患者的生存率 。这不仅有助于改善老年患者的医疗服务质量,还能在一定程度上缓解医疗资源的紧张局面,推动老年外科手术领域的发展 。该研究成果发表在《BMC Anesthesiology》杂志上,为相关领域的研究和临床实践提供了重要的参考 。
研究人员开展此项研究时,运用了以下主要关键技术方法:
- 数据收集与整理:从 KPNC 的医疗系统中收集老年急诊非心脏手术患者的 EHR 数据,涵盖患者基本信息、临床病史、生命体征、实验室检查结果等多方面数据,并进行整理筛选 。
- 模型构建与评估:运用逻辑回归、LASSO、决策树、随机森林、XGBoost 等机器学习算法构建预测模型。通过将数据集划分为训练集(80%)和测试集(20%),利用 10 折交叉验证对模型超参数进行调优,并采用 AUCROC、精确召回曲线下面积(AUCPRC)和校准曲线等指标评估模型性能 。
下面详细介绍研究结果:
- 研究人群特征:研究最初识别出 95704 名符合条件的老年患者,经过排除标准筛选后,最终纳入 66262 名患者 。这些患者的平均年龄为 78 岁,女性占比 53.9%,白人种族 / 民族占比 68.5% 。在手术类型方面,骨科手术占 25.7%,普通外科手术占 21.9%,胃肠手术占 21.1% 。
- 模型性能比较:通过对不同模型预测术后 30 天主要并发症和死亡率复合结局的性能比较发现,除决策树模型外,其他模型表现相似 。XGBoost 模型的 AUCROC 最高,达到 0.804,随机森林模型为 0.802,逻辑回归和 LASSO 模型均为 0.796,决策树模型最低,为 0.655 。在 AUCPRC 方面,XGBoost 模型同样表现最佳,为 0.593 。基于这些结果,研究人员选择 XGBoost 模型作为最终预测模型 。
- XGBoost 模型亚组分析:对 XGBoost 模型进行亚组分析发现,其在不同种族 / 民族、性别以及不同外科服务组中,预测准确性均较为稳定,AUCROC 在不同亚组间差异不大,且 95% 置信区间相互重叠 。这表明该模型具有良好的通用性,不受种族、性别和手术类型等因素的显著影响 。
- XGBoost 模型对单个临床结局的预测能力:XGBoost 模型在预测术后败血症、进行性肾功能不全或肾衰竭、死亡率等单个临床结局时,也展现出了较高的准确性,AUCROC 分别为 0.823、0.781 和 0.839 。这说明该模型不仅能有效预测复合结局,对于单个重要并发症和死亡风险的预测也具有重要价值 。
研究结论和讨论部分再次强调了 AGES 评分模型的重要意义。该模型利用机器学习算法和多中心患者队列数据,为老年急诊手术患者的术后风险预测提供了一种可靠的工具 。与以往的风险预测工具相比,AGES 评分模型能够更好地整合 EHR 数据,实现自动评估,且在不同人群和手术类型中表现稳定 。尽管研究存在一些局限性,如数据来源于特定医疗系统,可能影响结果的普适性;研究期间涵盖 COVID-19 大流行,其对术后并发症发生率的潜在影响有待进一步研究;未与其他现有风险评分进行直接比较等 。但不可否认的是,AGES 评分模型为临床医生提供了有价值的参考,有助于在围手术期更好地评估患者风险,促进医患之间的沟通和决策制定 。未来,需要进一步在更多临床环境中对该模型进行外部验证,并探索如何将其更好地整合到临床实践中,以切实改善老年急诊手术患者的预后 。