使用可解释机器学习模型早期预测创伤性和非创伤性横纹肌溶解症中的急性肾损伤：一项多中心外部验证研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Intelligent Medicine》：Early prediction of acute kidney injury in traumatic and non-traumatic rhabdomyolysis using an interpretable machine learning model: A multicenter study with external validation

【字体：大中小】 时间：2026年06月12日 来源：Journal of Intelligent Medicine

编辑推荐：

　　急性肾损伤（AKI）是横纹肌溶解症（RM）的常见且严重并发症，由于其多因素和异质性，早期风险分层仍具有挑战性。研究人员开发并外部验证了一个可解释机器学习（ML）模型，用于早期预测创伤性和非创伤性病因的RM中的AKI。数据来自四个公共重症监护数据库和中国三级医院

急性肾损伤（AKI）是横纹肌溶解症（RM）的常见且严重并发症，由于其多因素和异质性，早期风险分层仍具有挑战性。研究人员开发并外部验证了一个可解释机器学习（ML）模型，用于早期预测创伤性和非创伤性病因的RM中的AKI。数据来自四个公共重症监护数据库和中国三级医院的多中心队列。推导队列共纳入1569名患者，外部验证队列401名。入院24小时内的18个变量用于训练12个ML模型。性能通过受试者工作特征曲线下面积（AUC）评估，并使用SHapley Additive Explanations（SHAP）评估可解释性。随机森林模型表现最佳（AUC=0.940），并被简化为一个五变量模型，包括乳酸脱氢酶（LDH）、血清肌酐（SCr）、白蛋白（Alb）、凝血酶原时间（PT）和活化部分凝血活酶时间（APTT）。最终模型在内部验证和外部验证中分别达到0.919和0.900的AUC，在非创伤性（0.911）和创伤性（0.882）亚组中表现一致。这个可解释模型可能支持不同病因RM患者的早期风险分层。

横纹肌溶解症（rhabdomyolysis, RM）是一种由骨骼肌损伤引发的临床综合征，常导致急性肾损伤（acute kidney injury, AKI）等严重并发症。当前临床实践中，基于肌酸激酶（CK）和血清肌酐（SCr）等传统生物标志物的风险评估方法存在敏感性和特异性不足的问题，且这些指标常在肾损伤确立后才有明显变化，难以实现早期预警。此外，RM病因高度异质，可分为创伤性和非创伤性两种亚型，其病理生理机制和AKI风险特征存在显著差异，但既往预测模型较少针对不同病因进行分层验证。因此，开发一个能够早期预测RM患者AKI风险、兼具可解释性和跨病因泛化能力的模型具有重要临床价值。

研究人员利用来自四个公共重症监护数据库（MIMIC-IV、MIMIC-III CareVue子集、eICU-CRD和NWICU）以及中国三级医院多中心队列（BTMH）的数据，开展了回顾性多中心研究。推导队列纳入1569例RM患者，外部验证队列纳入401例。通过入院24小时内的18项临床变量，训练并比较了12种机器学习（machine learning, ML）模型。最终选择随机森林（random forest, RF）模型，并基于SHapley Additive Explanations（SHAP）全局特征重要性进行逐步特征消减，简化得到包含乳酸脱氢酶（lactate dehydrogenase, LDH）、SCr、白蛋白（albumin, Alb）、凝血酶原时间（prothrombin time, PT）和活化部分凝血活酶时间（activated partial thromboplastin time, APTT）的五变量模型。论文发表在《Journal of Intelligent Medicine》。

该研究采用的关键技术方法包括：从多个公共重症监护数据库（MIMIC-IV、MIMIC-III CareVue子集、eICU-CRD、NWICU）及中国BTMH队列提取数据；基于入院24小时内的18项临床变量，使用12种ML算法（如LightGBM、RF、XGBoost等）进行模型训练；采用受试者工作特征曲线下面积（AUC）进行性能评估；利用SHAP进行特征贡献的全局和局部可解释性分析；通过逐步特征消减获得简化的五变量模型，并在独立外部验证队列及创伤/非创伤亚组中验证。

**3 RESULTS**

**3.1 Patient characteristics**：推导队列中1569例患者，AKI发生率为68.0%。与未发生AKI的患者相比，AKI组年龄更大、体重更高、SCr和乳酸脱氢酶（LDH）水平更高，白蛋白（Alb）水平更低，凝血酶原时间（PT）和活化部分凝血活酶时间（APTT）更长（均p<0.001）。外部验证队列中401例患者，AKI发生率为29.7%，其中非创伤性RM亚组AKI发生率29.9%，创伤性RM亚组29.0%。

**3.2 Model development and comparative performance**：在推导队列中，使用入院24小时内18个变量训练12种ML模型。随机森林（RF）模型表现最优（AUC=0.940），其次为XGBoost（AUC=0.938）和LightGBM（AUC=0.938）。基于SHAP全局重要性进行逐步特征消减，RF在不同特征子集上始终优于其他算法。

**3.3 Final model selection**：在RF框架下，通过SHAP重要性排序逐步消减特征。18变量模型与5变量模型（LDH、SCr、Alb、PT、APTT）的AUC差异无统计学意义（ΔAUC=0.021，p=0.055），综合考虑模型简洁性与临床适用性，选择五变量RF模型作为最终模型。

**3.4 External validation and subgroup performance**：最终五变量RF模型在外部验证队列中AUC为0.900。亚组分析显示，非创伤性RM亚组AUC为0.911，创伤性RM亚组AUC为0.882，表明模型在不同病因亚组中均保持稳定判别性能。

**3.5 Model interpretability analysis**：通过SHAP全局分析，LDH和SCr是最重要的预测因子。SHAP依赖图显示：当SCr超过约2.0 mg/dL时，正向贡献增加；低Alb水平（约3 g/dL以下）与AKI风险升高相关。局部解释展示了代表性病例：未发生AKI者预测概率仅5.4%，而AKI者预测概率达94%，LDH和SCr贡献最大。

讨论部分总结：本研究系统比较了多种ML算法并引入可解释性技术，最终五变量RF模型在内部和外部验证中均表现良好。该模型基于早期可获得的临床变量，通过SHAP增强了透明度和临床可信度。研究在创伤性和非创伤性RM亚组中进行了分层外部验证，支持其跨病因泛化能力。但研究存在局限性：回顾性设计、推导队列主要来自ICU（重症监护病房）可能限制对普通病房患者的适用性、静态变量无法捕捉时间演变等。未来需前瞻性验证。

研究结论翻译：研究人员开发并外部验证了一个基于常规临床变量的可解释ML模型，用于预测RM患者AKI风险。最终RF模型在内部和外部验证队列（包括创伤性RM亚组）中均表现出稳定且良好的判别性能。通过整合SHAP可解释性分析，该模型不仅实现了强预测性能，还增强了透明度和临床可解释性。这种方法可能支持RM患者的早期风险分层。然而，在更广泛的临床实施之前，需要前瞻性研究来确定使用该模型是否能改善患者预后。

联系信箱：

粤ICP备09063491号

热点排行