基于SHAP可解释机器学习模型的终末期肾病患者CRRT期间体外循环凝血风险预测研究

【字体: 时间:2025年10月11日 来源:Renal Failure 3

编辑推荐:

  本研究创新性地应用机器学习算法构建终末期肾病(ESKD)患者连续性肾脏替代治疗(CRRT)期间体外循环凝血(ECC)风险预测模型。通过LASSO特征筛选和SMOTE样本平衡技术,比较支持向量机(SVM)、XGBoost等六种算法性能,最终SVM模型展现最优预测能力(AUC=0.864)。结合SHAP可解释性分析,明确低分子肝素(LMWH)初始剂量为最关键风险因素,为临床早期干预提供精准决策支持。

  
研究背景与方法学框架
慢性肾脏病(CKD)已成为全球公共卫生问题,终末期肾病(ESKD)患者数量逐年攀升。连续性肾脏替代治疗(CRRT)作为ESKD患者的重要治疗手段,其过程中体外循环凝血(ECC)会导致治疗中断、血液损失等严重后果。目前针对急性肾损伤(AKI)患者的ECC预测模型难以适用于ESKD人群,因两者在抗凝策略(ESKD多用低分子肝素LMWH)、治疗时长(ESKD通常6-8小时/次)和血流动力学参数存在显著差异。
本研究回顾性纳入北部战区总医院血液净化科2023年收治的636例ESKD行CRRT患者,其中199例发生ECC(发生率31.3%)。研究采用严谨的数据预处理流程:通过多重插补处理3.03%的缺失数据,应用合成少数类过采样技术(SMOTE)平衡数据集,并利用最小绝对收缩和选择算子(LASSO)算法从53个候选变量中筛选出9个关键特征(性别、超滤量、LMWH初始剂量、白细胞计数、血细胞比容、血小板计数、天冬氨酸氨基转移酶、钙离子、氯离子)。
模型构建与性能比较
研究采用十倍交叉验证构建六种预测模型:支持向量机(SVM)、极限梯度提升(XGBoost)、随机森林(RF)、梯度提升机(GBM)、决策树和逻辑回归(LR)。性能评估显示,SVM模型在曲线下面积(AUC=0.864)、布里尔分数(0.076)、灵敏度(0.780)等指标均显著优于其他模型。决策曲线分析(DCA)进一步证实SVM在大多数风险阈值下具有更高临床净获益。传统LR模型表现最差(AUC=0.717),凸显机器学习算法在复杂临床数据中的优势。
风险因素的SHAP解读
通过沙普利加和解释(SHAP)方法量化特征重要性,发现LMWH初始剂量(SHAP值0.058)为最强预测因子,其通过抗凝血酶激活和血小板抑制发挥核心抗凝作用。血小板计数(0.044)和超滤量(0.041)分列二三位,其中超滤量通过调节血液浓缩状态和血流动力学影响凝血风险。其余重要变量依次为钙离子(参与凝血级联反应)、天冬氨酸氨基转移酶(间接反映肝脏合成凝血因子功能)、血细胞比容(影响血液粘滞度)、白细胞计数(释放促凝物质)、性别(女性血栓风险更高)和氯离子(调节酸碱平衡)。
临床意义与局限性
本研究首次针对ESKD人群构建CRRT凝血风险预测模型,为个体化抗凝策略制定提供量化工具。例如可根据模型预测动态调整LMWH剂量或超滤参数。但研究存在单中心回顾性设计的局限性,未纳入局部枸橼酸抗凝策略患者,且尚未进行前瞻性临床验证。未来需通过多中心合作优化模型,并开发实时预测系统整合动态指标。
结论与展望
机器学习技术特别是SVM模型在ESKD患者CRRT凝血风险预测中展现卓越性能。结合SHAP可解释性分析,不仅提升模型临床可信度,更精准识别关键干预靶点。该研究为肾病领域人工智能辅助决策树立新范式,有望推动CRRT治疗向精准化、个性化方向迈进。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号