《Resuscitation Plus》:The Pre-ECPR Score for Predicting Favorable Neurological Outcomes After Extracorporeal Cardiopulmonary Resuscitation: Protocol for External Validation in the Prague OHCA Trial Cohort
编辑推荐:
本研究针对体外心肺复苏(ECPR)患者选择缺乏共识的临床难题,开展了Pre-ECPR评分系统的外部验证研究。通过对布拉格OHCA试验中92例ECPR治疗患者的前瞻性数据分析,验证该评分系统通过整合年龄、无灌注时间/初始心律组合、心脏骤停总时长、生命体征、瞳孔直径、呼气末CO2、局部脑氧饱和度(rSO2)和动脉pH等8个预测因子,预测良好神经功能结局(改良Rankin量表0-3分)的能力。研究结果将为ECPR患者选择提供超越传统二元标准的精准化工具,具有重要临床转化价值。
心脏骤停(Cardiac Arrest, CA)是全球范围内的重大公共卫生挑战。尽管传统心肺复苏(CPR)技术不断优化,但仍有大量患者无法实现自主循环恢复(Return of Spontaneous Circulation, ROSC)。体外心肺复苏(Extracorporeal Cardiopulmonary Resuscitation, ECPR)作为一种新兴的干预手段,为常规高级心脏生命支持(Advanced Cardiac Life Support, ACLS)无效的难治性心脏骤停患者带来了希望。美国心脏协会指南指出,在具备适当培训和设备的医疗系统中,对经过选择的患者使用ECPR是合理的(中等推荐强度,中等质量证据)。
然而,ECPR的实施面临严峻挑战。meta分析显示,仅有约20%的ECPR治疗患者能够获得良好的神经功能结局(定义为改良Rankin量表[modified Rankin Scale, mRS]评分0-3分),这意味着高达80%的患者经历了不良结局。考虑到ECPR是一项资源密集型的高强度治疗,这种低成功率问题尤为突出。因此,建立优化的患者选择标准,在避免无效治疗的同时确保潜在获益者能够获得治疗机会,成为ECPR临床应用的核心问题。
目前,ECPR患者选择策略存在显著的异质性。一项系统评价共识别出文献中93种不同的ECPR选择方案。这些方案通常包含年龄、无灌注时间(no-flow time)和低灌注时间(low-flow time)等参数,部分方案还纳入了生理学指标,如呼气末CO2(end-tidal CO2)水平或CPR期间的生命体征。然而,这些连续变量通常被转换为二分类的纳入或排除标准,且不同方案间的阈值截断值差异巨大。这种对连续参数的二分法处理存在明显局限,它通过人为设定的阈值将连续变量转化为是/否标准,无法捕捉变量与结局之间的动态关系。
近期回顾性研究清晰展示了这一困境:严格标准虽然提高了入选患者的存活率,但排除了大量不符合所有标准但实际可能存活的患者;而宽松标准虽然排除了较少患者,却导致了高比率的无效治疗和低存活率。此外,大多数方案对心脏骤停持续期间的患者评估仍较为有限。
为应对这些挑战,Pre-ECPR评分应运而生。该评分采用逻辑回归模型,将多个加权预测因子作为连续变量纳入,预测ECPR术后一年良好神经功能结局的概率。在内部交叉验证中,该评分展示了优于体外生命支持组织(Extracorporeal Life Support Organization, ELSO)ECPR选择标准示例的判别性能(受试者工作特征曲线下面积[area under the receiver operating characteristic curve, ROC AUC] 0.79 vs. 0.63)。然而,内部验证不足以确立模型在不同医疗环境中的泛化性能,外部验证成为评估评分系统普遍适用性和可重复性的必要步骤。
为此,研究人员设计并实施了这项针对Pre-ECPR评分的外部验证研究,该研究方案发表于《Resuscitation Plus》杂志。研究团队选择布拉格院外心脏骤停(Prague OHCA)试验队列作为验证集,这是迄今为止最大的随机CPR/ECPR试验,提供了92例ECPR治疗患者的高质量前瞻性数据,包括所有Pre-ECPR评分所需变量的系统收集和标准化神经功能结局评估。
本研究采用的关键技术方法包括:利用布拉格OHCA试验队列的92例ECPR治疗患者作为外部验证集;采用逻辑回归模型计算个体化预后概率;通过校准(包括校准度、校准斜率和校准图)、判别(ROC AUC和Tjur判别指数)和风险分层分析评估模型性能;必要时进行模型重新校准;并遵循TRIPOD+AI(Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis prediction model + AI)指南进行结果报告。
方法
验证队列
验证队列由布拉格OHCA试验中的92例ECPR患者组成。该单中心随机对照试验于2013年3月至2020年10月在布拉格进行。队列纳入标准包括年龄18-65岁、疑似心源性病因的目击型院外心脏骤停、急诊医疗服务团队进行至少5分钟ACLS后未实现持续ROSC的无意识患者。排除标准包括非心源性OHCA、未目击的倒地、妊娠、ACLS开始后5分钟内实现ROSC、意识清醒患者等。患者被随机分配至侵入性策略组(立即转运进行ECPR)或标准策略组(持续现场CPR)。标准策略组中部分交叉接受ECPR治疗的患者也纳入本验证队列。
结局
验证的主要终点是ECPR治疗后1年存活且神经功能良好(mRS 0-3分),与Pre-ECPR评分开发时使用的定义一致。在验证队列中,由对初始治疗策略不知情的神经科医生在两个时间点评估神经功能结局:ECPR治疗后6个月使用脑功能分类(Cerebral Performance Category, CPC)量表评估;中位5.3年时使用CPC和mRS量表评估。为确定1年mRS评分,将系统审查医疗记录以查找可能改变神经功能状态的干预事件。
盲法
在对结局数据不知情的情况下计算验证队列中每个个体的良好结局概率。同样,模型开发队列与验证队列之间的比较也在不知情情况下进行。此后解除盲态,以便进行完整的模型性能评估和后续分析。
预测模型
Pre-ECPR评分通过逻辑回归模型估算ECPR术后一年良好神经功能结局(mRS 0-3分)的概率。模型纳入八个预后因素:年龄、无灌注时间/初始心律组合、心脏骤停总时长、生命体征、瞳孔直径、呼气末CO2、INVOS设备测量的局部脑氧饱和度(rSO2)和动脉pH值。评分计算使用完整模型(当所有数据齐全时)或针对缺失动脉pH或INVOS rSO2的修改模型。
预测因子评估
所有Pre-ECPR评分变量均在布拉格OHCA试验中前瞻性收集,但均未用于研究期间的ECPR决策。年龄、初始心律、无灌注时间和心脏骤停总时长记录于试验的病例报告表中。在导管室进行患者评估时,还获取了以下变量:生命体征(自主运动或呼吸努力)、瞳孔大小、呼气末CO2、INVOS监测的rSO2和动脉pH值。
样本量
基于92例参与者和20例良好神经功能结局事件(事件率22%),在假设ROC AUC为0.80的情况下,研究预计可获得以下精确度估计:AUC的95%置信区间半宽约为0.12,观测事件数与预期事件数之比(O:E)的半宽约为0.34,校准斜率的半宽约为0.7。
统计分析
模型性能评估遵循Debray等人提出的预测模型外部验证方法框架。将通过校准(校准度、校准斜率和校准图)、判别(ROC AUC和Tjur判别指数)和风险分层分析评估模型性能。将在不同概率阈值(包括先前确定的6.4%概率截断值)计算敏感性、特异性、阳性和阴性预测值以及似然比。如果原始模型在验证队列中表现不理想或存在显著失拟,将通过更新模型截距和/或校准斜率进行重新校准。
结论与讨论
本研究方案详细规划了使用布拉格OHCA试验数据对Pre-ECPR评分进行外部验证的预设透明计划。分析将遵循最先进的外部验证方法学标准,并按照TRIPOD+AI指南进行报告。研究结果将揭示内部验证中展示的预测性能是否在外部验证队列中得以保持,表明其更广泛的临床适用潜力。
Pre-ECPR评分是首个将静态变量(年龄、初始心律)、连续骤停持续时间、床旁生理学标志物(pH、rSO2、呼气末CO2)和简单临床观察(瞳孔大小、自主运动)相结合的评分系统,提供了比传统二元标准更细致的概率估计。与先前方案相比,Pre-ECPR评分通过将变量作为连续而非二分类参数使用,并利用逻辑回归加权,提供了一年后良好结局概率的单一统一预测,从而充分利用每个参数的预测能力。
布拉格OHCA试验为验证提供了高质量的队列,因其作为迄今最大的随机CPR/ECPR试验,提供了前瞻性收集的数据、标准化方案以及心脏骤停期间对Pre-ECPR评分所需所有变量的系统评估。试验设计确保了高质量的数据收集和有限的变量缺失。此外,由神经科医生进行的结局评估确保了可靠且标准化的神经功能结局分类。
尽管存在样本量限制(92例患者,20个事件)可能制约检测细微失校准或判别性能下降的能力,但这项外部验证是测试评分普适性和识别潜在重新校准需求的重要步骤。Pre-ECPR评分为心脏骤停和ECPR领域引入了更为精细和个体化的预后评估方法,有望优化患者选择,最大化治疗效益,同时减少无效医疗。未来的研究方向包括在更大队列中进行进一步验证、探索评分在不同医疗环境中的表现,以及最终实现临床转化应用。