《Journal of Intelligent Medicine》:Early prediction of acute kidney injury in traumatic and non-traumatic rhabdomyolysis using an interpretable machine learning model: A multicenter study with external validation
编辑推荐:
急性肾损伤(AKI)是横纹肌溶解症(RM)的常见且严重并发症,由于其多因素和异质性,早期风险分层仍具有挑战性。研究人员开发并外部验证了一个可解释机器学习(ML)模型,用于早期预测创伤性和非创伤性病因的RM中的AKI。数据来自四个公共重症监护数据库和中国三级医院
急性肾损伤(AKI)是横纹肌溶解症(RM)的常见且严重并发症,由于其多因素和异质性,早期风险分层仍具有挑战性。研究人员开发并外部验证了一个可解释机器学习(ML)模型,用于早期预测创伤性和非创伤性病因的RM中的AKI。数据来自四个公共重症监护数据库和中国三级医院的多中心队列。推导队列共纳入1569名患者,外部验证队列401名。入院24小时内的18个变量用于训练12个ML模型。性能通过受试者工作特征曲线下面积(AUC)评估,并使用SHapley Additive Explanations(SHAP)评估可解释性。随机森林模型表现最佳(AUC=0.940),并被简化为一个五变量模型,包括乳酸脱氢酶(LDH)、血清肌酐(SCr)、白蛋白(Alb)、凝血酶原时间(PT)和活化部分凝血活酶时间(APTT)。最终模型在内部验证和外部验证中分别达到0.919和0.900的AUC,在非创伤性(0.911)和创伤性(0.882)亚组中表现一致。这个可解释模型可能支持不同病因RM患者的早期风险分层。
横纹肌溶解症(rhabdomyolysis, RM)是一种由骨骼肌损伤引发的临床综合征,常导致急性肾损伤(acute kidney injury, AKI)等严重并发症。当前临床实践中,基于肌酸激酶(CK)和血清肌酐(SCr)等传统生物标志物的风险评估方法存在敏感性和特异性不足的问题,且这些指标常在肾损伤确立后才有明显变化,难以实现早期预警。此外,RM病因高度异质,可分为创伤性和非创伤性两种亚型,其病理生理机制和AKI风险特征存在显著差异,但既往预测模型较少针对不同病因进行分层验证。因此,开发一个能够早期预测RM患者AKI风险、兼具可解释性和跨病因泛化能力的模型具有重要临床价值。
研究人员利用来自四个公共重症监护数据库(MIMIC-IV、MIMIC-III CareVue子集、eICU-CRD和NWICU)以及中国三级医院多中心队列(BTMH)的数据,开展了回顾性多中心研究。推导队列纳入1569例RM患者,外部验证队列纳入401例。通过入院24小时内的18项临床变量,训练并比较了12种机器学习(machine learning, ML)模型。最终选择随机森林(random forest, RF)模型,并基于SHapley Additive Explanations(SHAP)全局特征重要性进行逐步特征消减,简化得到包含乳酸脱氢酶(lactate dehydrogenase, LDH)、SCr、白蛋白(albumin, Alb)、凝血酶原时间(prothrombin time, PT)和活化部分凝血活酶时间(activated partial thromboplastin time, APTT)的五变量模型。论文发表在《Journal of Intelligent Medicine》。
该研究采用的关键技术方法包括:从多个公共重症监护数据库(MIMIC-IV、MIMIC-III CareVue子集、eICU-CRD、NWICU)及中国BTMH队列提取数据;基于入院24小时内的18项临床变量,使用12种ML算法(如LightGBM、RF、XGBoost等)进行模型训练;采用受试者工作特征曲线下面积(AUC)进行性能评估;利用SHAP进行特征贡献的全局和局部可解释性分析;通过逐步特征消减获得简化的五变量模型,并在独立外部验证队列及创伤/非创伤亚组中验证。
**3 RESULTS**
**3.1 Patient characteristics**:推导队列中1569例患者,AKI发生率为68.0%。与未发生AKI的患者相比,AKI组年龄更大、体重更高、SCr和乳酸脱氢酶(LDH)水平更高,白蛋白(Alb)水平更低,凝血酶原时间(PT)和活化部分凝血活酶时间(APTT)更长(均p<0.001)。外部验证队列中401例患者,AKI发生率为29.7%,其中非创伤性RM亚组AKI发生率29.9%,创伤性RM亚组29.0%。
**3.2 Model development and comparative performance**:在推导队列中,使用入院24小时内18个变量训练12种ML模型。随机森林(RF)模型表现最优(AUC=0.940),其次为XGBoost(AUC=0.938)和LightGBM(AUC=0.938)。基于SHAP全局重要性进行逐步特征消减,RF在不同特征子集上始终优于其他算法。
**3.3 Final model selection**:在RF框架下,通过SHAP重要性排序逐步消减特征。18变量模型与5变量模型(LDH、SCr、Alb、PT、APTT)的AUC差异无统计学意义(ΔAUC=0.021,p=0.055),综合考虑模型简洁性与临床适用性,选择五变量RF模型作为最终模型。
**3.4 External validation and subgroup performance**:最终五变量RF模型在外部验证队列中AUC为0.900。亚组分析显示,非创伤性RM亚组AUC为0.911,创伤性RM亚组AUC为0.882,表明模型在不同病因亚组中均保持稳定判别性能。
**3.5 Model interpretability analysis**:通过SHAP全局分析,LDH和SCr是最重要的预测因子。SHAP依赖图显示:当SCr超过约2.0 mg/dL时,正向贡献增加;低Alb水平(约3 g/dL以下)与AKI风险升高相关。局部解释展示了代表性病例:未发生AKI者预测概率仅5.4%,而AKI者预测概率达94%,LDH和SCr贡献最大。
讨论部分总结:本研究系统比较了多种ML算法并引入可解释性技术,最终五变量RF模型在内部和外部验证中均表现良好。该模型基于早期可获得的临床变量,通过SHAP增强了透明度和临床可信度。研究在创伤性和非创伤性RM亚组中进行了分层外部验证,支持其跨病因泛化能力。但研究存在局限性:回顾性设计、推导队列主要来自ICU(重症监护病房)可能限制对普通病房患者的适用性、静态变量无法捕捉时间演变等。未来需前瞻性验证。
研究结论翻译:研究人员开发并外部验证了一个基于常规临床变量的可解释ML模型,用于预测RM患者AKI风险。最终RF模型在内部和外部验证队列(包括创伤性RM亚组)中均表现出稳定且良好的判别性能。通过整合SHAP可解释性分析,该模型不仅实现了强预测性能,还增强了透明度和临床可解释性。这种方法可能支持RM患者的早期风险分层。然而,在更广泛的临床实施之前,需要前瞻性研究来确定使用该模型是否能改善患者预后。