基于SHAP可解释机器学习模型的终末期肾病患者CRRT期间体外循环凝血风险预测研究
【字体:
大
中
小
】
时间:2025年10月11日
来源:Renal Failure 3
编辑推荐:
本研究创新性地应用机器学习算法构建终末期肾病(ESKD)患者连续性肾脏替代治疗(CRRT)期间体外循环凝血(ECC)风险预测模型。通过LASSO特征筛选和SMOTE样本平衡技术,比较支持向量机(SVM)、XGBoost等六种算法性能,最终SVM模型展现最优预测能力(AUC=0.864)。结合SHAP可解释性分析,明确低分子肝素(LMWH)初始剂量为最关键风险因素,为临床早期干预提供精准决策支持。
慢性肾脏病(CKD)已成为全球公共卫生问题,终末期肾病(ESKD)患者数量逐年攀升。连续性肾脏替代治疗(CRRT)作为ESKD患者的重要治疗手段,其过程中体外循环凝血(ECC)会导致治疗中断、血液损失等严重后果。目前针对急性肾损伤(AKI)患者的ECC预测模型难以适用于ESKD人群,因两者在抗凝策略(ESKD多用低分子肝素LMWH)、治疗时长(ESKD通常6-8小时/次)和血流动力学参数存在显著差异。
本研究回顾性纳入北部战区总医院血液净化科2023年收治的636例ESKD行CRRT患者,其中199例发生ECC(发生率31.3%)。研究采用严谨的数据预处理流程:通过多重插补处理3.03%的缺失数据,应用合成少数类过采样技术(SMOTE)平衡数据集,并利用最小绝对收缩和选择算子(LASSO)算法从53个候选变量中筛选出9个关键特征(性别、超滤量、LMWH初始剂量、白细胞计数、血细胞比容、血小板计数、天冬氨酸氨基转移酶、钙离子、氯离子)。
研究采用十倍交叉验证构建六种预测模型:支持向量机(SVM)、极限梯度提升(XGBoost)、随机森林(RF)、梯度提升机(GBM)、决策树和逻辑回归(LR)。性能评估显示,SVM模型在曲线下面积(AUC=0.864)、布里尔分数(0.076)、灵敏度(0.780)等指标均显著优于其他模型。决策曲线分析(DCA)进一步证实SVM在大多数风险阈值下具有更高临床净获益。传统LR模型表现最差(AUC=0.717),凸显机器学习算法在复杂临床数据中的优势。
通过沙普利加和解释(SHAP)方法量化特征重要性,发现LMWH初始剂量(SHAP值0.058)为最强预测因子,其通过抗凝血酶激活和血小板抑制发挥核心抗凝作用。血小板计数(0.044)和超滤量(0.041)分列二三位,其中超滤量通过调节血液浓缩状态和血流动力学影响凝血风险。其余重要变量依次为钙离子(参与凝血级联反应)、天冬氨酸氨基转移酶(间接反映肝脏合成凝血因子功能)、血细胞比容(影响血液粘滞度)、白细胞计数(释放促凝物质)、性别(女性血栓风险更高)和氯离子(调节酸碱平衡)。
本研究首次针对ESKD人群构建CRRT凝血风险预测模型,为个体化抗凝策略制定提供量化工具。例如可根据模型预测动态调整LMWH剂量或超滤参数。但研究存在单中心回顾性设计的局限性,未纳入局部枸橼酸抗凝策略患者,且尚未进行前瞻性临床验证。未来需通过多中心合作优化模型,并开发实时预测系统整合动态指标。
机器学习技术特别是SVM模型在ESKD患者CRRT凝血风险预测中展现卓越性能。结合SHAP可解释性分析,不仅提升模型临床可信度,更精准识别关键干预靶点。该研究为肾病领域人工智能辅助决策树立新范式,有望推动CRRT治疗向精准化、个性化方向迈进。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号